﻿le trimite la blocul de decodare Blocul de decodificare, la rândul său, transmite instrucțiunile decodificate blocurilor funcționale adecvate pentru execuție În unele cazuri, blocul de decodare poate împărți instrucțiunile individuale în micro-operații înainte de a le trimite la blocuri funcționale În mod clar, este cel mai ușor să executați toate instrucțiunile în ordinea în care sunt apelate din memorie (presupunând că predicția ramurilor este întotdeauna corectă) Cu toate acestea, din cauza interdependenței comenzilor, această execuție secvențială nu oferă întotdeauna performanțe optime Dacă o instrucțiune necesită o valoare care este calculată de o instrucțiune anterioară, a doua instrucțiune nu poate fi executată până când prima instrucțiune returnează valoarea dorită Astfel, într-o situație de reală interdependență, echipa a doua trebuie să aștepte Există și alte tipuri de interdependențe, dar despre ele vom vorbi mai târziu Pentru a ocoli aceste probleme și a obține performanțe optime, unele procesoare omit instrucțiunile interdependente și trec la următoarele instrucțiuni (independente) Desigur, în acest caz, algoritmul de distribuție a comenzilor ar trebui să dea același rezultat ca și cum toate comenzile ar fi executate în ordinea în care sunt scrise Și acum să demonstrăm pe un exemplu specific cum sunt reordonate comenzile Pentru a stabili cheia problemei, să începem cu o mașină care rulează comenzi în ordinea în care apar în program și necesită ca executarea comenzilor să fie finalizată și în ordinea corespunzătoare programului Importanța celei de-a doua cerințe va deveni clar mai târziu Creșterea productivității Mașina noastră conține registre accesibile programatorului, de la R la R Toate instrucțiunile aritmetice folosesc trei registre: doi pentru operanzi și unul pentru rezultat, ca în microarhitectura Mis- Presupunem că, dacă o instrucțiune este decodificată în ciclul n, execuția începe în ciclul n + În cazul unei instrucțiuni simple, cum ar fi o instrucțiune de adunare sau scădere, scrierea înapoi în registrul de ieșire are loc la sfârșitul ciclului n + În cazul unei instrucțiuni mai complexe, de exemplu o instrucțiune de multiplicare, registrul este scris la sfârșitul ciclului n + Pentru a face exemplul nostru realist, vom permite decodorului să emită până la două instrucțiuni pe ciclu Unele procesoare superscalare pot genera sau chiar instrucțiuni pe ciclu Secvența de execuție a comenzii este ilustrată în tabel Prima coloană arată numărul ciclului, a doua coloană arată numărul comenzii, iar a treia coloană arată comanda în sine A patra coloană arată comenzile emise (maximum două comenzi pe ciclu) Numerele din coloana a cincea vă spun ce comenzi sunt completate Amintiți-vă că, în exemplul nostru, solicităm ca comenzile să înceapă și să se termine într-o anumită ordine, astfel încât emiterea comenzii k + poate avea loc numai după emiterea comenzii k, iar rezultatul comenzii k + nu poate fi scris în registrul de ieșire înainte de modul în care se va termina comanda k Restul de coloane vor fi discutate mai târziu După ce comanda este decodificată, decodorul trebuie să stabilească dacă să ruleze comanda imediat sau nu Pentru a face acest lucru, blocul de decodare trebuie să cunoască starea tuturor registrelor Dacă, de exemplu, instrucțiunea curentă necesită un registru a cărui valoare nu a fost încă calculată, instrucțiunea curentă nu este emisă și CPU este forțat să rămână inactiv Este apelat la un dispozitiv special pentru a monitoriza starea registrelor - tabloul de bord, care a apărut pentru prima dată în sistemul CDC Pentru fiecare registru, contorul de acces conține un mic circuit care numără de câte ori acest registru este folosit ca sursă de către executarea comenzilor Dacă se pot executa maximum instrucțiuni în același timp, va fi suficient un contor de biți Când se rulează o instrucțiune, intrările contorului de acces corespunzătoare registrelor de operanzi sunt incrementate cu Când instrucțiunea este finalizată, intrările contorului corespunzătoare sunt decrementate cu Contorul de acces conține scheme de numărare similare pentru registrele țintă Deoarece este permisă o singură scriere la un moment dat, aceste scheme pot avea o dimensiune de un bit Cele coloane din dreapta tabelului arată citirile contorului de lovituri Pe mașinile reale, contorul de acces ține, de asemenea, evidența utilizării blocului funcțional pentru a evita emiterea unei instrucțiuni pentru care nu este disponibil niciun bloc funcțional Pentru simplitate, presupunem că un bloc funcțional adecvat este întotdeauna disponibil, astfel încât blocurile funcționale nu sunt afișate în tabel În prima linie a tabelului Figura prezintă instrucțiunea , care înmulțește valorile registrelor R și R și plasează rezultatul în registrul R Deoarece niciunul dintre aceste registre nu este încă în uz, instrucțiunea rulează și contorul de acces arată că registrele R și R sunt citite și registrul R este scris Tabel - Procesor superscalar cu emiterea și completarea secvențială a comenzilor Ciclu unsprezece # Comanda dvs - Completați - Citiți registrele Scrieți registrele cabana R = R x R R = R + R R = R + R R = R + R - R = R x R R = R - R - R = R x R - R = R + R - Creșterea productivității Nicio instrucțiune ulterioară nu poate scrie în aceste registre și nu poate citi R până la finalizarea instrucțiunii Deoarece aceasta este o instrucțiune de multiplicare, se va termina la sfârșitul buclei Valorile contorului de acces date pe fiecare linie reflectă starea se înregistrează după rularea comenzii scrise pe aceeași linie Celulele goale corespund valorii Deoarece exemplul este o mașină superscalară care poate rula două instrucțiuni pe ciclu, a doua instrucțiune este emisă și în timpul ciclului Adaugă valorile registrelor R și R și stochează rezultatul în registrul R Pentru a determina dacă această comandă poate fi executată, se aplică următoarele reguli: Dacă este scris orice operand, comanda nu poate fi rulată (dependență RAW) Dacă registrul rezultat este citit, comanda nu poate fi rulată (dependență WAR) Dacă registrul rezultat este scris, comanda nu poate fi rulată (dependență WAW) Am analizat deja dependențele reale (dependențe RAW) care apar atunci când o comandă trebuie să folosească rezultatul unei comenzi anterioare care nu a fost încă finalizată ca sursă Celelalte două tipuri de interdependențe sunt mai puțin grave În esență, ele sunt legate de conflicte de resurse Cu dependența WAR (Write After Read), o instrucțiune încearcă să suprascrie un registru pe care instrucțiunea anterioară nu a terminat încă de citit Dependența WAW (Write After Write) este similară cu dependența WAR Această interdependență poate fi evitată dacă a doua comandă pune rezultatul în altă parte (poate temporar) Dacă nu intervine nici una dintre cele trei situații menționate și blocul funcțional dorit este disponibil, comanda poate fi emisă În acest caz, instrucțiunea utilizează registrul R , care este în prezent citit de o instrucțiune incompletă, dar o astfel de suprapunere este permisă, astfel încât instrucțiunea poate rula În mod similar, comanda este rulată în timpul ciclului Acum să trecem la instrucțiunea , care ar trebui să folosească registrul R Din păcate, putem vedea din tabel în care R este în prezent scris (vezi linia din tabel) Există o dependență RAW aici, astfel încât blocul de decodare este inactiv până când registrul R devine disponibil În timpul inactiv, blocul de decodare nu mai primește comenzi de la blocul de preluare a comenzii Când tampoanele interne ale blocului de preluare a instrucțiunilor sunt pline, acesta oprește preluarea instrucțiunilor din memorie De menționat că următoarea comandă, comanda , nu intră în conflict cu niciuna dintre comenzile finalizate Ar putea fi decodificat și emis dacă sistemul nostru nu ar necesita ca comenzile să fie emise în ordine strictă Să vedem ce se întâmplă în bucla Instrucțiunea , care este instrucțiunea de adăugare (două bucle), se termină la sfârșitul buclei Dar rezultatul ei nu poate fi stocat Capitolul Stratul de microarhitectură în registrul R (care va fi apoi eliberat pentru instrucțiunea ) De ce? Din cauza necesității de a scrie rezultatele în registre în conformitate cu ordinea de execuție a programului Dar de ce? Ce este în neregulă cu stocarea rezultatului în R acum și cu acea valoare disponibilă? Răspunsul la această întrebare este foarte important Să presupunem că comenzile pot fi completate în orice ordine Apoi, în cazul unei întreruperi, va fi foarte dificil să salvați starea mașinii pentru a putea fi restabilită ulterior În special, nu se va putea spune că toate instrucțiunile până la o anumită adresă au fost executate și că toate instrucțiunile de după acea adresă nu au fost executate, așa cum ar fi cazul așa-numitei întreruperi exacte, care este o caracteristică de dorit a procesorului central [ ] Stocarea rezultatelor în ordine aleatorie face ca întreruperile să fie inexacte, motiv pentru care unele mașini necesită o ordine strictă de terminare a comenzii Să revenim la exemplul nostru La sfârșitul ciclului , rezultatele tuturor celor trei instrucțiuni pot fi stocate, astfel încât instrucțiunea poate fi emisă în ciclul , precum și instrucțiunea recent decodificată poate fi deja emisă În bucla , instrucțiunea este inactivă deoarece trebuie să scrie rezultatul în registrul R , iar registrul R este ocupat Execuția unei instrucțiuni nu începe până la ciclul Este nevoie de cicluri pentru a finaliza întreaga secvență de instrucțiuni din cauza numeroaselor situații de interdependență, deși hardware-ul este capabil să emită două instrucțiuni pe ciclu Conform coloanelor "Emitere" și "Completare" din Tabel se poate observa că toate comenzile sunt emise din blocul de decodare în ordine și aceste comenzi sunt, de asemenea, completate în ordine Să luăm în considerare o abordare alternativă: execuția cu resecvențiere Într-un astfel de sistem, execuția comenzilor poate începe într-o ordine arbitrară și se poate termina și într-o ordine arbitrară În tabel Figura arată aceeași secvență de opt comenzi, doar că acum este permisă ordinea arbitrară de emitere a comenzilor și stocarea rezultatelor în registre Prima diferență apare în bucla Chiar dacă instrucțiunea este inactivă, putem decoda și rula instrucțiunea deoarece nu intră în conflict cu niciuna dintre instrucțiunile de rulare Cu toate acestea, omiterea comenzilor creează o nouă problemă Să presupunem că instrucțiunea utilizează un operand care este evaluat de instrucțiunea omisă Cu starea curentă a contorului de acces, nu vom observa acest lucru Ca urmare, va trebui să extindem contorul de accesări pentru a ține evidența înregistrărilor pe care le fac comenzile sărite Acest lucru se poate face prin adăugarea unui alt bitmap, un bit per registru, pentru a controla scrierile pe care le fac instrucțiunile inactive (acești contoare nu sunt afișați în tabel) Regula de pornire a instrucțiunii ar trebui extinsă pentru a preveni executarea unei instrucțiuni al cărei operand ar fi trebuit să fie scris de o instrucțiune anterioară, dar omise Acum să ne uităm la echipele , și din tabel Aici vedem că instrucțiunea pune valoarea calculată în registrul R și acea valoare este utilizată de instrucțiunea Tabelul , Funcționarea unui procesor superscalar cu modificarea ordinii de pornire și finalizare a comenzilor Loop # Command You- Complete- Citiți registrele Scrieți registrele cabana R = R x R R = R + R R = R + R R = R + R - R = R x R S = R - R R = R x S S = R + R - unsprezece Capitolul Stratul de microarhitectură De asemenea, vedem că această valoare nu mai este necesară deoarece instrucțiunea suprascrie valoarea registrului R Nu este nevoie să folosiți registrul R pentru a stoca rezultatul instrucțiunii Și mai rău, alegerea registrului R ca registru intermediar este departe de a fi cea mai bună, deși, din punctul de vedere al unui programator obișnuit cu ideea de ​Executarea secvenţială a instrucţiunilor fără suprapunere, această alegere este cea mai rezonabilă În tabel În Secțiunea , am introdus o nouă metodă pentru a rezolva această problemă, redenumirea registrului Blocul de decodificare înlocuiește registrul R în instrucțiunile (bucla ) și (bucla ) cu registrul S ascuns de programator După aceea, instrucțiunea poate rula simultan cu instrucțiunea Procesoarele moderne conțin zeci de registre ascunse care sunt folosite pentru înlocuire Această tehnologie elimină adesea dependențele WAR și WAW În comanda aplicăm din nou înlocuirea majusculelor Acest registru temporal R este înlocuit cu registrul S , astfel încât operația de adăugare poate începe înainte ca registrul R să fie eliberat și este eliberat doar la sfârșitul ciclului Dacă se dovedește că rezultatul ar trebui să fie în registrul R în acel moment, conținutul registrului S poate fi întotdeauna copiat acolo Și mai bine, toate instrucțiunile viitoare care folosesc acest rezultat vor putea folosi registrul de substituție ca sursă, care stochează de fapt valoarea dorită În orice caz, comanda va începe mai devreme În computerele reale (nu ipotetice), înlocuirea registrului are loc cu imbricare multiplă Există multe registre ascunse și un tabel care arată corespondența dintre registrele disponibile și ascunse ale programatorului De exemplu, pentru a găsi locația registrului R , trebuie să vă referiți la intrarea din acest tabel De fapt, nu există un registru real R , ci doar o legătură între numele R și unul dintre registrele ascunse Această relație se schimbă adesea în timpul execuției programului pentru a evita interdependențele Acordați atenție coloanei a patra și a cincea a tabelului Puteți vedea că comenzile sunt executate în neregulă și, de asemenea, completate în afara ordinii Concluzia este foarte simplă: prin schimbarea secvenței de execuție a comenzilor și înlocuirea registrelor, putem accelera procesul de calcul de aproape două ori Execuție speculativă În secțiunea anterioară, am introdus conceptul de reordonare a instrucțiunilor pentru a îmbunătăți performanța Ceea ce s-a vrut cu adevărat a fost reordonarea comenzilor într-un singur bloc de bază al programului Să luăm în considerare acest aspect mai detaliat Programele de calculator pot fi împărțite în blocuri de bază, fiecare dintre acestea fiind o secvență liniară de instrucțiuni cu un punct de intrare la început și un punct de ieșire la sfârșit Blocul de bază nu conține nicio structură de control (cum ar fi instrucțiuni condiționale if sau instrucțiuni while loop), deci nu sunt create ramuri atunci când sunt traduse în limbajul mașinii Blocurile de bază sunt conectate de către operatorii de control Creșterea productivității Un program în această formă poate fi reprezentat ca un grafic direcționat, așa cum se arată în Fig Aici calculăm suma cuburilor întregi pare și impare până la o anumită limită și stocăm rezultatele în variabilele sumă pare și, respectiv, sumă impară (Listing ) În cadrul fiecărui bloc, tehnologiile menționate în subsecțiunea anterioară funcționează foarte bine Orez Graficul bloc de bază pentru fragmentul de program prezentat în Lista Lista Fragment de program evesum=O; oddsum= ; = ; whlle (I ) z = y/x; Aici x, y și z sunt variabile în virgulă mobilă Să presupunem că toate aceste variabile intră în registre în avans, iar instrucțiunea de divizare în virgulă mobilă (această instrucțiune este lentă) se deplasează în sus pe grafic și se execută chiar înainte de instrucțiunea condițională if Din păcate, dacă valoarea lui x este , atunci programul se termină ca urmare a unei încercări de împărțire la Astfel, instrucțiunea speculativă face ca programul corect inițial să eșueze Mai rău încă, programatorul modifică programul pentru a preveni o astfel de situație, dar accidentul apare în continuare O soluție posibilă este versiunile speciale ale acelor comenzi care pot arunca excepții În plus, la fiecare registru se adaugă un așa-numit bit otravă Dacă instrucțiunea speculativă eșuează, nu declanșează o capcană de excepție, ci setează bitul otravă în registrul de rezultate Dacă acest registru este apoi folosit de o instrucțiune normală, excepția este capturată (cum ar trebui să fie în cazul unei excepții) Cu toate acestea, dacă acest rezultat nu este utilizat, bitul otravă este resetat și nu afectează în niciun fel fluxul programului Exemple la nivel de microarhitectură În această secțiune, în lumina materialului abordat în acest capitol, ne vom uita la trei procesoare moderne Prezentarea noastră va fi scurtă, deoarece calculatoarele sunt extrem de complexe, conțin milioane de porți și nu suntem în măsură să oferim o descriere detaliată Exemplele de procesoare sunt aceleași ca înainte - Pentium , UltraSPARC III și Microarhitectura procesorului Pentium La prima vedere, Pentium arată ca o mașină CISC destul de tradițională, cu un set de instrucțiuni mare și greu de manevrat, care acceptă operații cu numere întregi pe , și de biți, precum și operațiuni cu virgulă mobilă pe și de biți Are doar registre disponibile, iar niciunul nu le repetă pe celelalte Lungimea admisă a comenzii este de - octeți În general, există o arhitectură moștenită standard care face totul greșit De fapt, procesorul Pentium se bazează pe un nucleu RISC modern, fiabil, cu pipelining avansat Viteza sa de ceas este deja foarte mare și este probabil să crească și mai mult în următorii ani Este uimitor cum inginerii Intel, bazați pe o arhitectură arhaică, au reușit să construiască un procesor care să îndeplinească toate cerințele moderne Deci, în această subsecțiune, ne vom uita la microarhitectura Pentium și vom înțelege cum funcționează Capitolul Stratul de microarhitectură Prezentare generală a microarhitecturii NetBurst Microarhitectura Pentium , numită NetBurst, a marcat o abatere decisivă de la principiile microarhitecturii P utilizate în procesoarele Pentium Pro, Pentium II și Pentium III Oferă o idee pe ce bază vor fi dezvoltate produsele Intel în următorii câțiva ani O diagramă aproximativă a microarhitecturii Pentium este prezentată în fig Într-o anumită măsură, corespunde cu figura Orez Microarhitectura Pentium Pentium constă din patru blocuri principale: subsistemul de memorie, blocul de preprocesare, blocul de control al execuției de resecvențiere și blocul de execuție Luați în considerare aceste blocuri în ordine, începând din stânga sus și mișcându-se în sens invers acelor de ceasornic Subsistemul de memorie include un cache L combinat, precum și o logică pentru accesarea RAM externă prin magistrala de memorie În prima generație Pentium , L avea KB; în al doilea - KB; în al treilea - MB L este un cache asociativ cu căi cu linii de de octeți Dacă cererea către memoria cache de nivel al doilea eșuează, se fac două transferuri de de octeți în memoria principală, după care sunt selectate blocurile necesare din aceasta Acest cache L aparține categoriei de cache-uri Exemple la nivel de microarhitectură scriere întârziată Cu alte cuvinte, noile date din rândul modificat sunt scrise înapoi în memorie numai după resetare Strâns asociat cu memoria cache este un prefetcher (neprezentat în figură) care încearcă să mute datele din memoria principală în L înainte ca datele să fie solicitate Din L , datele pot fi transferate cu viteză mare către alte blocuri cache O operație de preluare L poate fi efectuată pe ciclu; Deci, la o frecvență de ceas de GHz, până la , miliarde de blocuri de de octeți pe secundă pot fi transferate teoretic din L în alte cache - astfel, debitul devine egal cu GB / s Sub cel prezentat în fig , subsistemul memorie conține o unitate de preprocesare care selectează instrucțiunile din L și le decodifică în ordinea în care sunt executate instrucțiunile programului Fiecare instrucțiune la nivelul ISA este împărțită într-o secvență de micro-opțiuni asemănătoare RISC Pentru a simplifica comenzile, blocul fetch-decode determină ce micro-opțiuni sunt necesare pentru a rezolva problemele interne În cazuri mai complexe, se face o căutare a unei secvențe de micro-operații în memoria micro-instrucțiunilor În orice caz, comanda Pentium ISA este convertită într-o secvență de micro-operații care urmează să fie executate de miezul RISC al cipului Acest mecanism vă permite să "construiți punți" între setul de instrucțiuni CISC moștenit și calea de date RISC modernă Micro-opțiunile decodificate sunt trimise în cache-ul de urmărire, care este memoria cache de instrucțiuni de prim nivel Deoarece nu instrucțiunile originale sunt stocate în cache, ci micro-opțiunile decodificate, nu este nevoie să re-decodați atunci când preluați instrucțiunea din memoria cache de urmărire Aceasta este una dintre cele mai semnificative discrepanțe între microarhitecturile NetBurst și P (în cea din urmă, instrucțiunile Pentium au fost păstrate în memoria cache de instrucțiuni de prim nivel) Predicția ramurilor este, de asemenea, efectuată aici Comenzile sunt transmise din memoria cache de urmărire către planificatorul de comenzi în ordinea determinată de program, dar atunci când sunt executate, sunt posibile abateri de la această ordine Când se găsește un micro-op care nu poate fi executat, planificatorul de instrucțiuni îl reține în timp ce continuă să proceseze fluxul de instrucțiuni - sunt lansate toate instrucțiunile ulterioare care nu implică accesarea resurselor ocupate (registre, blocuri funcționale etc ) Aici se realizează și înlocuirea registrului, astfel încât instrucțiunile interdependente WAR și WAW să poată fi executate fără întârziere După cum sa menționat deja, ordinea în care sunt lansate comenzile poate să nu corespundă cu cea prevăzută în program În același timp, cerința arhitecturii Pentium privind întreruperile precise spune că comenzile ISA trebuie să returneze rezultate fără a se abate de la secvența specificată de program Blocul stațiunii este responsabil pentru implementarea acestei cerințe În partea dreaptă sus a figurii, este afișat un bloc de execuție, care combină blocuri de execuție specializate care efectuează direct operații cu numere întregi, operații în virgulă mobilă și instrucțiuni specializate Există mai multe unități de execuție care rulează în paralel Ei își obțin datele din fișierul de registru și din memoria cache a datelor de la primul nivel Capitolul Stratul de microarhitectură Conducta NetBurst Pe fig Figura prezintă o diagramă mai detaliată a microarhitecturii NetBurst, inclusiv conducta acesteia În partea de sus a diagramei este un bloc de preprocesare responsabil pentru preluarea instrucțiunilor din memorie și pregătirea lor pentru execuție Acest bloc primește noi instrucțiuni Pentium din memoria cache L în bucăți de de biți Ele sunt decodificate în micro-operații și plasate în memoria cache a urmelor Cache-ul de urmărire are o capacitate de µops și este comparabil ca performanță cu un cache L tradițional de K sau K Orez Diagrama de traseu a datelor Pentium simplificată Exemple la nivel de microarhitectură În memoria cache de urmărire, fiecare șase micro-operații sunt combinate într-un grup care ocupă o linie Micro-operațiunile cu o singură linie sunt executate fără a întrerupe secvența, deși pot fi formate din comenzi Pentium ISA la mii de octeți distanță Pentru a forma secvențe mai extinse de micro-operații, se practică îmbinarea șirurilor trasate Dacă o comandă Pentium ISA necesită mai mult de patru micro-operații pentru a fi executată, aceasta nu este decodificată și plasată în memoria cache de urmărire În schimb, este prevăzut cu un marker special care obligă sistemul să caute micro-operații în memoria micro-instrucțiuni Astfel, logica de execuție de resecvențiere obține micro-operații prin preluarea instrucțiunilor ISA decodificate anterior din memoria cache de urmărire sau prin căutarea online a instrucțiunilor ISA complexe (de exemplu, instrucțiuni de schimbare a liniilor) în memoria micro-instrucțiuni La întâlnirea unei comenzi de ramificare necondiționată, decodorul caută obiectul de ramificare prezis în primul nivel Branch Target Buffer (BTB) și continuă decodificarea de la adresa corespunzătoare Cache-ul tampon al obiectului de salt de la primul nivel stochează ultimele de salturi Dacă instrucțiunea de salt necesară nu este în tabel, se aplică predicția statică Aceasta înseamnă că tranziția inversă, în primul rând, face parte din ciclu și, în al doilea rând, nu este ocupată Precizia prognozei statice în acest caz este foarte mare Saltul înainte este considerat neocupat și face parte din structura instrucțiunii if Precizia unei prognoze statice în cazul tranzițiilor directe este mult mai mică decât în cazul celor inversate Pentru a prezice micro-opțiunile de tranziție, este utilizat un buffer de urme ale obiectelor de tranziție sau urme VTB A doua componentă a conductei, logica de execuție de resecvențiere, preia date dintr-un cache de urmărire cu o capacitate de microops Când fiecare microoperație ulterioară sosește din blocul de preprocesare (și sunt trei pe ciclu), blocul de distribuție și substituție o înregistrează într-un tabel format din de intrări și numit buffer de reordonare a comenzii (ReOrder Buffer, ROB) Acest buffer stochează date despre starea micro-operației, până la resortarea rezultatelor acesteia Apoi blocul de distribuție și substituție verifică disponibilitatea resurselor necesare realizării micro-operației Dacă resursele sunt libere, micro-operația este plasată într-una dintre cozile de execuție Sunt furnizate cozi separate pentru micro-operațiunile executate în memorie și în afara memoriei Dacă executarea unei micro-operații este imposibilă în prezent, aceasta se amână, dar procesarea micro-operațiilor ulterioare continuă; astfel, micro-opțiunile sunt adesea executate în afara secvenței lor inițiale Acest principiu vă permite să mențineți încărcarea tuturor blocurilor funcționale la cel mai înalt nivel posibil În orice moment, până la de comenzi pot fi procesate simultan, dintre ele pot fi încărcate din memorie, iar pot fi stocate în memorie Uneori, micro-operatorii sunt inactiv Acest lucru se întâmplă atunci când mai multe micro-opțiuni încearcă să acceseze același registru pentru citire sau scriere; în consecință, unul dintre ei reușește, iar restul - Capitolul Stratul de microarhitectură Nu Astfel de conflicte, după cum am aflat deja, se numesc interdependențe WAR și WAW Înlocuirea registrului țintă vă permite să scrieți rezultatele execuției microoperației într-unul dintre cele de registre temporare, ceea ce înseamnă că puteți executa această microoperație imediat Dacă toate registrele temporare sunt indisponibile sau micro-op intră într-o situație de dependență RAW (care nu poate fi ocolită), planificatorul indică natura problemei sub forma unei intrări în buffer-ul ROB Ulterior, după eliberarea tuturor resurselor necesare, micro-operația este plasată într-una dintre cozile de execuție Blocul de distribuție și înlocuire pune operațiunile pregătite pentru execuție într-una din cele două cozi Patru programatori sunt responsabili pentru extragerea microinstrucțiunilor din cozi Fiecare planificator reglează accesul la anumite resurse: Scheduler - ALU și bloc offset în virgulă mobilă Scheduler - ALU și un bloc pentru executarea operațiilor în virgulă mobilă Scheduler - descărcați comenzi Scheduler - salvare comenzi Deoarece programatoarele și ALU-urile rulează cu dublul ratei de ceas nominală, primele două programatoare pot transmite două micro-operații pe ciclu Cu două ALU-uri întregi care rulează de asemenea la o viteză de două ori mai mare, procesorul Pentium de GHz este capabil să efectueze miliarde de operații cu numere întregi pe secundă Datorită vitezei atât de mari, unitatea de control al execuției de resecvențiere are unele dificultăți la încărcarea ALU Instrucțiunile de încărcare și stocare trec printr-o singură unitate de execuție, care rulează cu o frecvență dublă, care poate apela o instrucțiune de ambele tipuri în timpul unui ciclu Astfel, în cel mai bun caz (în absența operațiilor în virgulă mobilă), pot fi apelate micro-opțiuni întregi pe ciclu Cele două ALU-uri întregi nu sunt la fel ALU efectuează orice operații și tranziții aritmetice și logice ALU este capabil doar să execute instrucțiuni de adunare, scădere, deplasare și rotire Cele două blocuri de execuție în virgulă mobilă nu sunt, de asemenea, identice Primul efectuează doar ture și comenzi SSE Al doilea acceptă aritmetica în virgulă mobilă, precum și comenzile MMX și SSE Unitățile de execuție ALU și în virgulă mobilă primesc date din două fișiere de registru cu o capacitate de de intrări Unul dintre aceste fișiere este pentru numere întregi, celălalt pentru numere în virgulă mobilă Acestea conțin toți operanzii necesari executării instrucțiunilor; în plus, ele joacă rolul unui depozit de rezultate Datorită înlocuirii registrelor, opt dintre ele conțin registre accesibile la nivelul arhitecturii instrucțiunilor (EAX, EBX, ECX, EDX etc ), dar locația valorilor "reale" în fiecare caz depinde de modificările în maparea care apar în timpul execuției Cache-ul de date de la primul nivel este una dintre componentele schemei de mare viteză ( x) Cu o capacitate de KB, stochează numere întregi, numere în virgulă mobilă și alte tipuri de date Spre deosebire de memoria cache de urmărire, aceste date nu sunt Exemple la nivel de microarhitectură cumva nu decodificat Funcția cache-ului de date este de a stoca copii ale octeților în memorie În ceea ce privește caracteristicile sale, primul nivel cache de date este un cache asociativ cu căi cu o capacitate de linie de de octeți Acceptă trecerea la scriere; cu alte cuvinte, atunci când o linie de cache se modifică, este imediat copiată înapoi în cache-ul de al doilea nivel În timpul unui ciclu, memoria cache a datelor de la primul nivel procesează o operație de citire și una de scriere Dacă cuvântul solicitat nu poate fi găsit în memoria cache de primul nivel, o solicitare este trimisă în memoria cache de al doilea nivel; acesta din urmă într-o astfel de situație poate răspunde fie imediat, fie după ce a preluat din memorie linia corespunzătoare În orice moment, până la patru interogări pot fi în execuție, direcționate din memoria cache de nivel întâi către memoria cache de nivel al doilea Deoarece micro-opțiunile sunt executate în afara secvenței, stocarea în memoria cache de primul nivel este posibilă numai după resortarea rezultatelor tuturor comenzilor care preced comanda de stocare Această resortare a rezultatelor cu urmărirea lor (ținând evidența unde se află) este realizată de blocul de resortare În cazul unei întreruperi, procesarea tuturor comenzilor care nu au trecut încă de recurgerea rezultatelor este încheiată; în acest fel, este îndeplinită cerința ca întreruperea să completeze toate instrucțiunile până la un anumit punct din program Dacă o comandă de stocare și-a reordonat rezultatele, dar comenzile anterioare sunt încă procesate, rezultatele execuției lor sunt transferate în buffer-ul de comandă în așteptare din cauza imposibilității actualizării cache-ului de prim nivel În acest buffer pot fi plasate până la de comenzi de salvare simultan Dacă una dintre comenzile de încărcare ulterioare încearcă să citească datele stocate, aceasta va fi redirecționată din bufferul de comandă în așteptare direct la comanda care nu este încă plasată în memoria cache de date de la primul nivel în acel moment Acest proces se numește redirecționare de la magazin la încărcare Deci, este destul de evident că Pentium are o microarhitectură complexă, a cărei soluție de proiectare este determinată de necesitatea de a sprijini setul de instrucțiuni Pentium moștenit pe un nucleu RISC modern, cu un nivel ridicat de pipelining Acest obiectiv este atins prin împărțirea instrucțiunilor Pentium în micro-op-uri, memorarea lor în cache și trecerea lor (trei micro-op-uri la un moment dat) către conductă, unde sunt executate de mai multe ALU-uri, care, în condiții optime, procesează până la șase micro-operații -ops pe ciclu Micro-opțiunile sunt executate în afara secvenței, dar sunt returnate și stocate în cache-urile de primul și al doilea nivel, în ordinea specificată Informații mai detaliate despre microarhitectura NetBurst sunt prezentate în [ ] Microarhitectura procesorului UltraSPARC III Cu Seria de procesoare UltraSPARC de la Sun este o implementare a versiunii a arhitecturii SPARC La prima vedere, toate modelele sunt foarte asemănătoare și diferă în principal în ceea ce privește performanța și prețul În același timp, la nivel de microarhitectură, ele diferă semnificativ În această secțiune noi Capitolul Stratul de microarhitectură Să discutăm despre procesorul UltraSPARC III Cu Abrevierea "Cu" din numele modelului indică faptul că conductorii microcircuitului sunt din cupru - spre deosebire de conductorii de aluminiu utilizați în modelele anterioare Rezistența cuprului este mai mică decât rezistența aluminiului, din această cauză firele devin mai subțiri, iar viteza este mai mare UltraSPARC III Cu este o mașină pe de biți cu registre de de biți și o cale de date pe de biți, dar pentru compatibilitate cu mașinile Versiunea (care sunt pe de biți), poate funcționa pe operanzi pe de biți și software scris pentru versiunile pe de biți ale SPARC, nu este necesară nicio modificare Deși arhitectura internă a mașinii folosește de biți, magistrala de memorie are o lățime de de biți, similar unui procesor Pentium II cu o arhitectură de de biți și o magistrală de memorie de de biți În ambele cazuri, în același sistem sunt instalate o magistrală și un procesor de generații diferite Spre deosebire de Pentium , procesorul UltraSPARC a fost conceput inițial ca un sistem RISC complet Prin urmare, nu a fost nevoie de un mecanism complex pentru convertirea vechilor comenzi CISC în micro-operații în acest caz Comenzile kernelului sunt micro-opțiuni gata făcute Situația este oarecum complicată de apariția în ultimii ani a unor noi comenzi pentru procesarea datelor grafice și multimedia, care necesită dispozitive speciale pentru a fi executate Prezentare generală a sistemului UltraSPARC III Cu Diagrama structurală a UltraSPARC III Cu este prezentată în fig În general, este mult mai simplă decât microarhitectura NetBurst utilizată în sistemele Pentium , datorită arhitecturii mai puțin sofisticate a setului de instrucțiuni UltraSPARC Cu toate acestea, unele componente de bază sunt similare cu Pentium În primul rând, acest lucru se datorează factorilor tehnologici și economici De exemplu, în perioada de proiectare a acestor microcircuite, volumul cache-urilor de date ale primului a fost de la la KB Ambele microcircuite considerate corespundeau acestui standard Atunci când producerea memoriei cache L cu o capacitate de MB devine justificată din punct de vedere tehnologic și economic, toate procesoarele vor fi echipate cu noi cache-uri Diferențele dintre Pentium și UltraSPARC III Cu sunt legate în principal de faptul că, în primul caz, dezvoltatorii au trebuit să ofere suport pentru setul moștenit de comenzi CISC, în timp ce în al doilea, o astfel de sarcină nu a fost stabilită În partea din stânga sus a Fig Figura prezintă un cache de instrucțiuni asociative cu căi de K cu linii de de octeți Deoarece majoritatea instrucțiunilor UltraSPARC au octeți, aproximativ de instrucțiuni pot fi plasate în acest cache la un moment dat Pe această bază, UltraSPARC III Cu este oarecum inferior cache-ului de urmărire NetBurst Blocul de apel de comandă pregătește până la patru comenzi pe ciclu pentru execuție În cazul accesului nereușit la memoria cache a primului nivel, numărul de comenzi apelate este redus Când este detectat un salt condiționat, este accesat un tabel de salt cu o capacitate de de intrări; pe baza conținutului său, se ia decizia de a apela următoarea comandă sau comanda situată la adresa țintă Îmbunătățiți fiabilitatea prognozei Exemple la nivel de microarhitectură ramificarea este ajutată de biți suplimentari asociați cu fiecare cuvânt din memoria cache a instrucțiunilor Comenzile pregătite intră în buffer-ul cu comenzi, care uniformizează fluxul de comenzi direcționate către conducte Orez Diagrama structurală a procesorului UltraSPARC III Cu După cum se arată în fig , din bufferul de comenzi, comenzile intră în blocul pentru executarea operațiilor întregi, blocul pentru executarea operațiilor în virgulă mobilă și blocul încărcare/salvare Blocul de execuție a operațiunilor întregi este format din două ALU și o conductă scurtă pentru procesarea comenzilor de tranziție În plus, există registre ISA și registre temporare Blocul de execuție în virgulă mobilă este format din de registre și trei ALU independente pentru efectuarea operațiilor de adunare/scădere, înmulțire și, respectiv, împărțire Același bloc efectuează operații grafice Blocul de încărcare/salvare, după cum sugerează și numele, este responsabil pentru gestionarea diferitelor comenzi de încărcare și stocare Căile de date pe care le conține oferă conexiuni la trei cache-uri Cache-ul de date este un cache convențional asociativ cu căi de prim nivel, cu o capacitate de KB și o lungime de linie de de octeți Cache-ul de preluare prealabilă de K este necesar deoarece stratul de arhitectură de instrucțiuni UltraSPARC oferă instrucțiuni de preluare preliminară care permit compilatorului să apeleze cuvinte înainte de a fi necesare Dacă compilatorul crede că va avea nevoie de un anumit cuvânt după un timp, rulează comanda prefetch Ca rezultat, rândul corespunzător este preîncărcat în memoria cache de prefatch și după Capitolul Stratul de microarhitectură mai multe comenzi care accesează această linie este semnificativ mai rapidă decât dacă nu ar fi fost încărcată În unele situații, se realizează și preîncărcarea hardware, ceea ce face posibilă creșterea vitezei programelor moștenite care nu acceptă preluarea preliminară a software-ului Cache-ul de scriere este un bloc mic ( KB) de memorie cache conceput pentru a combina rezultatele unei scrieri și, prin urmare, pentru a optimiza consumul de resurse al magistralei late ( de biți) care duce la cache-ul de al doilea nivel Singurul scop al memoriei cache de scriere este de a îmbunătăți performanța Cipul UltraSPARC III Cu include, de asemenea, logica de control al accesului la memorie Este format din trei componente: o interfață de sistem, un controler cache de nivel al doilea și un controler de memorie Interfața sistemului asigură interacțiunea cu memoria printr-o magistrală de de biți Toate cererile către exterior trec prin această interfață, cu excepția solicitărilor către cache-ul de al doilea nivel Teoretic, atunci când se utilizează adrese de memorie fizică pe de biți, memoria principală poate fi de până la TB, dar dimensiunea plăcii de circuit imprimat pe care este instalat procesorul limitează această cifră la GB Soluția de proiectare a interfeței vă permite să conectați mai multe procesoare UltraSPARC la un singur modul de memorie simultan, formând astfel un multiprocesor Multiprocesoarele vor fi discutate în capitolul Controlerul cache L interfață cu un cache L integrat care este situat în afara cipul procesorului Cu plasarea externă a cache-ului de al doilea nivel, volumul acestuia poate fi de , sau chiar MB Lungimea liniei depinde de dimensiunea memoriei cache (de la de octeți într-un cache de MB la octeți într-un cache de MB) Amintiți-vă că memoria cache Pentium L se află pe cip și, din cauza lipsei de spațiu liber pe acesta, volumul său este limitat la MB Astfel, UltraSPARC oferă un raport de accesare a cache-ului semnificativ mai mare decât Pentium (datorită dimensiunii mari a cache-ului), dar viteza de acces este mai mică aici (deoarece cache-ul este situat în afara cipului) Controlerul de memorie convertește adresele virtuale de de biți în adrese fizice de de biți UltraSPARC acceptă memoria virtuală (vezi capitolul ) cu dimensiuni de pagină de , și KB, precum și MB Pentru a accelera procesul de conversie, sunt furnizate tabele speciale numite Translation Lookaside Buffers (TLB) Ei compară adresa virtuală actuală cu adresele care au fost accesate în trecutul recent Trei dintre aceste tabele oferă control flexibil asupra dimensiunilor paginilor de date și alte două gestionează comenzile de conversie Transportor UltraSPARC III Cu Transportorul UltraSPARC III Cu în trepte este prezentat în formă simplificată în fig În partea stângă a figurii, pașii sunt marcați cu litere de la A la D Să luăm în considerare fiecare dintre ei separat Deschide treapta transportoare A (Generarea adresei - generarea adresei) Aceasta definește adresa fiecărei comenzi ulterioare care ar trebui să fie selectată De regulă, coincide cu adresa următoarei instrucțiuni, totuși, în unele cazuri, organizarea secvențială este întreruptă, de exemplu, dacă instrucțiunea anterioară este instrucțiunea Exemple la nivel de microarhitectură o ramură prezisă, o capcană de excepție sau o întrerupere care trebuie gestionată Deoarece nu este posibil să se prezică ramificarea într-un ciclu, instrucțiunea imediat următoare ramificației condiționate este oricum executată, indiferent de ținta ramificației Orez Diagrama simplificată a transportorului UltraSPARC III Cu Capitolul Stratul de microarhitectură Pe baza adresei definite anterior la etapa P (Preluare preliminară - preluare preliminară), comenzile sunt apelate din memoria cache a comenzilor de la primul nivel (până la patru per ciclu) Pentru a identifica săriturile condiționate și pentru a verifica corectitudinea prognozei, se fac apeluri către tabelul de sărituri Etapa F (Fetch) finalizează preluarea instrucțiunilor și transferul lor în memoria cache a instrucțiunilor La etapa B (Ținta de ramificație - detectarea obiectului de tranziție), comenzile selectate sunt decodificate Dacă între ele se găsesc tranziții prezise, acestea sunt trecute înapoi în etapa A pentru preluarea imediată a instrucțiunilor corespunzătoare În etapa I (formarea grupului de instrucțiuni), comenzile primite sunt sortate în grupuri, în funcție de care dintre cele șase blocuri funcționale se referă: ALU pentru a efectua operații cu numere întregi ALU pentru efectuarea de operații cu numere întregi ALU pentru operații în virgulă mobilă și grafice ALU pentru operații în virgulă mobilă și grafice Conducta de tranziție (nu este prezentată în Fig ) Operațiuni de încărcare și depozitare, precum și operațiuni speciale Există diferențe notabile atât între ALU-uri pentru efectuarea de operații cu numere întregi, cât și între ALU-uri pentru efectuarea operațiilor în virgulă mobilă și grafice În ambele cazuri, există seturi diferite de instrucțiuni pe care anumite ALU-uri sunt capabile să le execute Sortarea comenzilor în blocuri se realizează în etapa I La etapa J (Gruparea etapei instrucțiunilor - extragerea unei comenzi din coadă), comenzile sunt pregătite pentru a fi trimise blocului de execuție în timpul următorului ciclu Până la patru comenzi pot fi trimise la etapa R în timpul unui ciclu Alegerea comenzilor este limitată de disponibilitatea blocurilor funcționale De exemplu, puteți apela două instrucțiuni de operare cu numere întregi, o instrucțiune de operare în virgulă mobilă și o instrucțiune de încărcare sau stocare în același timp Cu toate acestea, este imposibil să rulați trei instrucțiuni pentru a efectua operații cu numere întregi într-un singur ciclu La etapa R (Registrul - registru) caută registrele necesare procesării instrucțiunilor pentru efectuarea operațiilor cu numere întregi Solicitările de furnizare de registre în virgulă mobilă sunt redirecționate către fișierul de registru corespunzător De asemenea, verifică existența interdependențelor Dacă registrul necesar nu este disponibil deoarece a fost ocupat de instrucțiunea anterioară, instrucțiunea curentă este suspendată și toate instrucțiunile ulterioare sunt blocate Spre deosebire de Pentium , UltraSPARC III Cu nu execută comenzi în afara secvenței Etapa E (Execuție - execuție) este destinată executării directe a comenzilor întregi Majoritatea operațiunilor aritmetice, booleene și de schimbare gestionate de ALU-uri întregi durează un ciclu pentru a fi finalizate De îndată ce comanda este finalizată, fișierul de înregistrare este actualizat în consecință Exemple la nivel de microarhitectură registru de lucru Unele comenzi întregi complexe sunt transmise unui bloc special În ceea ce privește comenzile de încărcare și salvare, în această etapă execuția lor începe doar, dar nu se termină Operanzii pentru executarea unei instrucțiuni în virgulă mobilă sunt preluați din fișierul de registru corespunzător La etapa £, pe lângă procesarea instrucțiunilor de sărituri condiționate, este determinată direcția acestora (săritură/fără sărituri) Dacă predicția este incorectă, semnalul este trimis înapoi la etapa L și conducta este eliberată La etapa C (Cache - cache), accesul la memoria cache a primului nivel este finalizat Rezultatele comenzilor care implică citirea datelor din memorie (de exemplu, comenzi de încărcare) sunt, de asemenea, definite aici Etapa M (Miss) procesează cuvintele solicitate, dar care nu au fost găsite în memoria cache de primul nivel În primul rând, se caută cache-ul de al doilea nivel, iar în cazul pierderii cache-ului, se efectuează un acces la memorie, care durează mai multe cicluri De asemenea, efectuează operații de extindere și aliniere a semnelor pentru octeți, sferturi de cuvinte și jumătate de cuvinte găsite în memoria cache de primul nivel Pentru operațiunile de încărcare în virgulă mobilă care au o lovitură de cache în memoria cache de preluare prealabilă, rezultatele pot fi preluate în acest moment Din motive de sincronizare, memoria cache de preluare preliminară nu este utilizată la procesarea datelor întregi La etapa W (Write - record), rezultatele sunt extrase dintr-un bloc special și scrise în fișierul de registru al registrului de lucru Etapa X (eXtend - Execuție extinsă) completează majoritatea graficelor și comenzilor în virgulă mobilă Înainte de resortarea formală a rezultatelor care are loc în pasul D, rezultatele acestor comenzi sunt furnizate comenzilor ulterioare prin redirecționare pentru descărcare La etapa T (Capcană - interceptare), sunt interceptate excepțiile asociate cu instrucțiuni întregi și instrucțiuni în virgulă mobilă Această etapă este responsabilă pentru capturarea excepțiilor și gestionarea întreruperilor Cu alte cuvinte, după apariția unei excepții sau a unei întreruperi, starea mașinii trebuie să îndeplinească anumite cerințe; în special, toate comenzile executate anterior trebuie să fie terminate, iar cele ulterioare anulate În etapa D, starea registrelor întregi și virgulă mobilă este capturată în fișierele de registru arhitectural corespunzătoare Când apare o excepție sau o întrerupere, aceste valori devin vizibile și nu conținutul registrelor de lucru Operația de scriere a unui registru într-un fișier arhitectural corespunde operației de recurgere a rezultatelor în procesoare Pentium În plus, în etapa D, rezultatele tuturor comenzilor de stocare finalizate sunt scrise în memoria cache de scriere (în locul cache-ului de date de la primul nivel) În cele din urmă, liniile acestui cache sunt scrise în cache-ul de al doilea nivel, ocolind cache-ul de prim nivel (conținutul său nu se suprapune cu conținutul cache-ului de al doilea nivel) Această schemă simplifică sarcina de a construi multiprocesoare UltraSPARC Descrierea noastră a cipului UltraSPARC III nu este exhaustivă, dar este suficientă pentru a vă oferi o idee despre cum funcționează și cum diferă de arhitectura Pentium Capitolul Stratul de microarhitectură Microarhitectura procesorului Microarhitectura procesorului (Fig ) este mult mai simplă decât precedentele două - Pentium și UltraSPARC Faptul este că dimensiunea acestui microcircuit este foarte mică (este format din de tranzistori) și a fost dezvoltat cu mult înainte ca tehnologia conductelor să devină populară În plus, dezvoltatorii au fost însărcinați să creeze un cip ieftin, nu rapid După cum știți, "ieftin" și "simplu" sunt concepte foarte apropiate, în timp ce ieftinitatea și viteza în contextul nostru sunt rareori combinate Autobuzul principal Orez Microarhitectura procesorului Centrală pentru microarhitectura este autobuzul principal Câteva registre îi sunt asociate, iar pentru majoritatea acestora, operațiunile de citire și scriere sunt efectuate de software Înregistrați reprezentantul ACC Exemple la nivel de microarhitectură Este principalul registru aritmetic în care sunt stocate majoritatea rezultatelor calculelor Aproape toate comenzile aritmetice trec prin el Registrul B este folosit pentru înmulțire și împărțire; în plus, la stocarea rezultatelor, acesta acționează ca un registru temporar Registrul SP este indicatorul stivei, la fel ca în majoritatea celorlalte sisteme, acesta indică vârful stivei Registrul de instrucțiuni IR conține instrucțiunile în curs de executare Registrele TMP și TMP sunt zăvoarele care servesc ALU Înainte de a executa operațiuni în ALU, operanzii corespunzători sunt copiați în aceste latch-uri Rezultatele calculelor din ALU sunt scrise în orice registru de scriere, la care accesul este asigurat de magistrala principală Codurile de stare care indică zero, negativ și altele asemenea sunt scrise în registrul PSW (Program Status Word) oferă module de memorie independente pentru stocarea datelor și a codului Capacitatea RAM pentru plasarea datelor este de (Model ) sau (Model ) octeți; în consecință, un registru RAM ADDR de biți este suficient pentru adresarea completă a acestei memorie În procesul de adresare RAM, adresa octetului țintă este plasată în registrul RAM ADDR, după care se accesează memoria Capacitatea memoriei codului poate ajunge la KB (cu condiția ca modulul de memorie să fie plasat în afara cipului), astfel încât registrul ROM ADDR are o lățime de biți Schema de adresare pentru codul programului din ROM folosind registrul ROM ADDR este similară cu schema de mai sus pentru memoria de date Registrul DPTR (Double Pointer) este un registru temporar de biți pentru gestionarea și asamblarea adreselor pe biți Registrul PC-ului este un numărător de programe pe biți; cu alte cuvinte, specifică adresa următoarei instrucțiuni care urmează să fie apelată și executată Registrul de incrementare a PC-ului este un modul hardware special care acționează ca un pseudo-registru Când conținutul registrului PC este copiat în el și apoi citit, valoarea acestuia este automat incrementată cu unu Nici PC-ul, nici incrementerul PC-ului nu pot fi accesate prin magistrala principală În cele din urmă, BUFFER este un alt registru temporar de biți De fapt, fiecare registru de biți din procesorul este format dintr-o pereche de registre de biți, fiecare dintre acestea putând fi operat într-un mod diferit În plus, are trei temporizatoare pe biți necesare pentru aplicațiile în timp real Există, de asemenea, patru porturi I/O pe biți prin care procesorul poate controla până la de butoane externe, lumini indicatoare, senzori, comutatoare etc Prezența temporizatoarelor și a porturilor I/O este cea care face posibilă utilizarea ca procesor încorporat fără a instala microcipuri suplimentare Procesorul este clasificat ca fiind sincron - majoritatea comenzilor pe care le procesează sunt finalizate într-un singur ciclu Fiecare ciclu este împărțit în șase părți numite stări În prima stare, următoarea comandă este apelată din ROM și este trimisă prin magistrala principală către re Capitolul Stratul de microarhitectură hyster IR În a doua stare, această comandă este decodificată, iar valoarea din registrul RS este mărită cu unu În a treia stare, operanzii sunt pregătiți; în al patrulea, unul dintre ele este transferat pe magistrala principală, după care, de regulă, este plasat în registrul TMP și acționează ca un operand ALU În aceeași stare, este posibil să copiați conținutul ACC în registrul TMP , după care ambele ALU-uri devin gata pentru procesare ulterioară În a cincea stare, comenzile ALU sunt executate În cele din urmă, în a șasea stare, rezultatele comenzilor ALU sunt trimise înapoi la magistrala principală În același timp, registrul ROM ADDR se pregătește să apeleze următoarea instrucțiune Dispozitivul ar putea fi descris mai detaliat, cu toate acestea, descrierea și circuitul disponibile prezentate în fig este suficient pentru a vă face o idee generală În rezumat, constă dintr-o magistrală principală (reducând astfel dimensiunea cipului), un set eterogen de registre, trei temporizatoare și patru porturi conectate la magistrala principală, precum și mai multe registre suplimentare conectate la magistrala locală În timpul fiecărui ciclu al căii de date, cele două ALU-uri primesc câte un operand ca intrare, după care, ca în sistemele mai moderne, rezultatele sunt stocate într-un registru Comparație între procesoarele Pentium, UltraSPARC și Aceste trei procesoare diferă unul de celălalt în multe privințe, dar au o caracteristică surprinzătoare care poate ajuta la proiectarea unui computer Pentium acceptă un set de instrucțiuni CISC vechi pe care inginerii Intel ar fi bucuroși să îl arunce în cel mai apropiat corp de apă, dar cu siguranță ar încălca legile de mediu UltraSPARC III este un sistem RISC clasic cu un set de instrucțiuni eficient este un procesor simplu de biți folosit ca computer încorporat Toate exemplele prezentate se bazează pe un set de registre și una sau mai multe ALU-uri care efectuează operații aritmetice și booleene simple pe operanzi din registre În ciuda diferențelor, toate cele trei mașini au blocuri funcționale similare Toate blocurile funcționale primesc micro-operații, care conțin codul de funcționare și indică, de asemenea, două registruri de intrare și unul de ieșire Toate pot efectua o micro-operație într-un singur ciclu Toate sunt canalizate și suportă predicția ramurilor În cele din urmă, toate conțin cache-uri separate de instrucțiuni și date Această asemănare internă nu este întâmplătoare; nu este deloc transferurile constante de ingineri de la o companie din Silicon Valley la alta Când ne-am uitat la microarhitecturile Mis- și Mis- , am văzut că este destul de simplu să construim o cale de date canalizată cu două registre ca surse, în care valorile acestor registre sunt trecute prin ALU și rezultatul este stocat în registru Pe fig este reprezentat grafic Rezumatul capitolului imaginea unui astfel de transportor Pentru tehnologia modernă, acesta este cel mai eficient sistem Principala diferență dintre Pentium și UltraSPARC III este modul în care comenzile ISA sunt transmise blocului funcțional Computerul Pentium trebuie să împartă instrucțiunile CISC pentru a le converti în formatul cu registre cerut de blocul funcțional Acest proces este prezentat în Fig - împărțirea comenzilor mari în micro-operații mici Aparatul UltraSPARC III nu trebuie să facă nimic, deoarece instrucțiunile sale sursă sunt deja micro-opțiuni convenabile și compacte Acesta este motivul pentru care majoritatea noilor arhitecturi ISA sunt de tip RISC, care oferă combinația optimă între setul de instrucțiuni și mecanismul de execuție intern Este util să comparăm cea mai recentă dezvoltare a noastră, microarhitectura Mis- , cu aceste trei mașini reale Mis- seamănă cel mai mult cu Pentium Ambele sisteme interpretează comenzi care nu sunt comenzi RISC Pentru a face acest lucru, ambele sisteme împart instrucțiunile în micro-operații, care indică codul de operare, două registru de intrare și unul de ieșire În ambele cazuri, micro-operațiunile sunt puse în coadă pentru execuții ulterioare În Міс- , micro-operațiile sunt începute strict în ordine, executate strict în ordine și, de asemenea, sunt finalizate strict în ordine În Pentium, micro-operații sunt pornite în ordine, executate în ordine aleatorie și finalizate din nou în ordine Nu este corect să compari Mis- și UltraSPARC III, deoarece instrucțiunile de sistem UltraSPARC III sunt instrucțiuni RISC (adică micro-opțiuni cu registre) Ele nu trebuie să fie împărțite sau combinate Ele pot fi executate așa cum sunt, fiecare într-un ciclu de cale de date În comparație cu Pentium și UltraSPARC III, este foarte simplu Microarhitectura sa seamănă mai mult cu RISC decât cu CISC, deoarece instrucțiunile simple sunt executate într-un singur ciclu, fără a fi împărțite în părți componente În nu sunt furnizate nici pipeline, nici stocarea în cache Comenzile sunt executate, executate și returnează rezultatele în ordine În simplitatea sa, procesorul seamănă cu Mis- Rezumatul capitolului Componenta principală a oricărui computer este calea datelor Conține mai multe registre, una, două sau trei magistrale și unul sau mai multe blocuri funcționale, cum ar fi un ALU și un schimbător În bucla principală, mai mulți operanzi sunt apelați din registre și trecuți pe magistrală către ALU și alte blocuri funcționale pentru execuție După finalizarea operației, rezultatele sunt din nou stocate în registre Calea datelor poate fi controlată de un secvențior care apelează microinstrucțiuni din memoria de control Fiecare microinstrucțiune conține biți care controlează calea datelor pentru un ciclu Acești biți determină ce operanzi să selecteze, ce operație să efectueze și ce să facă cu rezultatele În plus, fiecare microinstrucțiune indică către următoarea Capitolul Stratul de microarhitectură microinstrucțiune (de obicei conține adresa sa) Unele microinstrucțiuni modifică această adresă de bază folosind operația OR IJVM este o mașină stivuitoare cu coduri operaționale pe un singur octet care împing cuvinte pe stivă, scot cuvintele din stivă și efectuează diverse operații asupra cuvintelor din stivă (cum ar fi adăugarea lor) Acest capitol descrie firmware-ul pentru microarhitectura Mis- Prin adăugarea unei unități de preluare a instrucțiunilor pentru a încărca instrucțiuni dintr-un flux de octeți, un număr mare de accesări la contorul de instrucțiuni poate fi eliminat, iar viteza mașinii va crește semnificativ Există multe abordări pentru organizarea nivelului de microarhitectură, inclusiv o structură cu sau magistrale, câmpuri de microinstrucțiuni codificate sau decodificate, prezența sau absența unui apel anticipat, o conductă cu mai multe sau mai puține etape etc Mic- este o mașină simplă cu control program, execuție secvențială a comenzilor și absență completă a paralelismului Mis- , în schimb, este o microarhitectură cu un grad ridicat de paralelism și o conductă în etape Performanța computerului poate fi îmbunătățită în mai multe moduri, principalul fiind utilizarea memoriei cache Cache-urile mapate direct și cache-urile asociative cu acces multiplu permit accesări mai rapide la memorie Pe lângă utilizarea memoriei cache, sunt folosite predicția de ramuri (atât statice, cât și dinamice), execuția reflow și execuția de instrucțiuni speculative Cele trei procesoare ale noastre, Pentium , UltraSPARC III și , ca exemple, sunt similare prin faptul că microarhitecturile lor nu sunt evidente pentru programatori care scriu în limbaj de asamblare la nivel arhitectural Pentium implementează o schemă complexă de conversie a instrucțiunilor ISA în micro-operații, memorarea lor în cache, trecerea lor către nucleul RISC superscalar pentru execuție în afara secvenței, înlocuirea registrului și aplicarea tuturor celorlalte trucuri descrise în această carte pentru a overclock hardware-ul către cea mai mare viteză posibilă În ceea ce privește procesorul UltraSPARC III Cu, cu excepția conductei în mai multe etape, microarhitectura sa este destul de simplă: lansarea și executarea comenzilor, precum și primirea rezultatelor acestora, sunt efectuate fără modificarea secvenței comenzilor Procesorul este extrem de simplu - mai multe registre și un ALU sunt conectate la o magistrală principală Întrebări și sarcini În fig registrul magistralei B este codificat printr-un câmp de biți și magistrala C este reprezentată ca o hartă de biți De ce? În fig există un bloc "Most bit" Schițați-l Când câmpul JMPC este setat în microinstrucțiune, MBR este OR către câmpul NEXT ADDRESS pentru a obține adresa următoarei microinstrucțiuni Există circumstanțe în care Întrebări și sarcini Are sens să utilizați câmpul JMPC dacă NEXT ADDRESS conține valoarea x FF? Să presupunem că Lista are următoarea instrucțiune după instrucțiunea if: k = : Care va fi noul cod de asamblare, cu condiția ca compilatorul să se optimizeze? Scrieți două traduceri IJVM diferite ale următoarei instrucțiuni Java: = k + n + ; Scrieți în Java instrucțiunea care a devenit sursa următorului cod pentru IJVM: ÎNCĂRCARE j ÎNCĂRCARE k ISUB BIPUSH ISUB DUP ADAUG ISTORE În acest capitol, am menționat că la conversia următoarei instrucțiuni în formă binară, eticheta L trebuie să fie printre cele de cuvinte inferioare ale memoriei de control: dacă (Z) merge la LI; altfel mergi la L Eticheta LI poate fi, de exemplu, în celula cu adresa x și L în celula cu adresa x ? Explică de ce În microcomanda if cmpeq a microprogramului pentru Міс- , valoarea registrului MDR este copiată în registrul H, iar în rândul următor se scade valoarea registrului TOS din acesta S-ar părea că este mai convenabil să o scrieți într-o singură declarație: f cmpeq Z=MDR-TOS; rd De ce nu o fac? Cât timp va dura ca mașina Mis- , care funcționează la o frecvență de , GHz, să execute următorul operator Java: = j + k; Dați răspunsul în nanosecunde O intrebare asemanatoare, doar pentru aparatul Mis- , care functioneaza si la o frecventa de , GHz Pe baza rezultatului obținut, răspundeți, cât timp va dura să executați programul pe mașina Mis- dacă acest program este executat pe mașina Mis- în ns? I Scrieți firmware-ul Mic- pentru a implementa comanda POPTWO JVM Această comandă elimină primele două cuvinte din stivă Capitolul Stratul de microarhitectură Pe JVM, există coduri operaționale speciale de un octet pentru încărcarea variabilelor locale de la la în stivă, care sunt utilizate în locul comenzii normale ILOAD Ce modificări trebuie făcute mașinii IJVM pentru a utiliza cât mai bine aceste comenzi? Comanda ISHR (Integer Arithmetic Right Shift) este acceptată de JVM, dar nu este acceptată de IJVM Comanda scoate primele două cuvinte din stivă și le înlocuiește cu un singur cuvânt (rezultat) Al doilea cuvânt de stivă de sus este operandul care trebuie mutat Este deplasat la dreapta cu o valoare între și , inclusiv, în funcție de valoarea celor mai puțin semnificativi cinci biți ai cuvântului de sus din stivă (cei de biți rămași sunt ignorați) Bitul de semn este duplicat la dreapta cu același număr de biți ca și deplasarea Codul operațional pentru comanda ISHR este ( x A) Comanda ISHL (Integer Shift Left) este acceptată de JVM, dar nu este acceptată de IJVM Comanda scoate primele două cuvinte din stivă și le înlocuiește cu o singură valoare (rezultat) Al doilea cuvânt din stiva de sus este operandul care trebuie mutat Este deplasat la stânga cu o valoare între și , inclusiv, în funcție de valoarea celor mai puțin semnificativi cinci biți ai cuvântului de sus din stivă (ceilalți biți ai cuvântului de sus sunt ignorați) Zerourile sunt deplasate la stânga cu același număr de biți ca și deplasarea Codul operațional ISHL este ( x ) Comanda INVOKEVIRTUAL JVM trebuie să știe câți parametri are Pentru ce? Implementați comanda DLOAD JVM pentru Міс- Această comandă conține un index de un octet și împinge variabila locală din acea locație în stivă Apoi împinge următorul cuvânt cel mai înalt în stivă Desenați o mașină de stat pentru a marca un joc de tenis Regulile tenisului sunt următoarele Pentru a câștiga, trebuie să obții cel puțin puncte și să ai cel puțin puncte mai mult decât adversarul tău Începeți cu starea ( , ), ceea ce înseamnă că niciunul dintre voi nu are încă puncte Apoi adăugați o stare ( , ) care indică faptul că jucătorul A a marcat un punct Etichetați marginea de la starea ( , ) la starea ( , ) ca A Apoi adăugați starea ( , ) pentru a arăta că jucătorul B a marcat un punct și etichetați marginea în starea ( , ) ca B Continuați să adăugați stări și margini până când ați desenat toate stările posibile Reveniți la întrebarea anterioară Există stări care pot fi eliminate fără durere, fără a afecta rezultatul vreunui joc? Dacă da, care sunt echivalente? Desenați o mașină de stări de predicție a ramurilor care este mai fiabilă decât cea prezentată în Figura Ar trebui să schimbe predicția numai după trei predicții consecutive nereușite Registrul de deplasare prezentat în fig are o capacitate maximă de octeți Este posibil să construiți o unitate de preluare a instrucțiunilor cu un registru de deplasare de octeți? Și cu octeți? Întrebarea anterioară este legată de reducerea costului unității de preluare a instrucțiunilor Acum luați în considerare problema creșterii prețului Ar putea avea nevoie vreodată de o schimbare Întrebări și sarcini un registru nou cu o capacitate mai mare, să zicem octeți? Dacă da, de ce? Dacă nu, de ce nu? În microprogramul pentru microarhitectura Mic- , microinstrucțiunea f icmpeq sare la T dacă bitul Z este setat la Totuși, microinstrucțiunea T este aceeași ca pentru gotol Este posibil să treceți imediat la gotol și va funcționa mașina mai repede după aceea? În microarhitectura Mis- , blocul de decodare mapează opcode IJVM la indexul ROM, unde sunt stocate microop-urile corespunzătoare Se pare că ar fi mai ușor să săriți peste etapa de decodare și să puneți imediat în coadă codul operațional IJVM Apoi puteți utiliza codul operațional IJVM ca index în ROM-ul micro-op, la fel ca în microarhitectura Mic- Ce este greșit în acest sens? Computerul conține o memorie cache cu două niveluri Să presupunem că % din accesările la memorie sunt accesări cache L , % sunt accesări cache L și % sunt rateuri cache Timpii de acces sunt de , și, respectiv, ns, cu timpii de acces la memoria cache L și la memoria principală numărați din momentul în care se știe că este necesară memoria corespunzătoare (de exemplu, accesul la cache L nu poate începe) apare) Care este timpul mediu de acces? La sfârșitul subsecțiunii "Cache" din secțiunea "Îmbunătățirea performanței", s-a remarcat că completarea cu scrierea este benefică numai dacă există scrieri repetate pe aceeași linie de cache Și ce se întâmplă dacă mai multe lecturi din aceeași linie urmează scrierea? Va fi utilă completarea după înregistrare în acest caz? În versiunea în schiță a acestei cărți din fig , în loc de un cache asociativ cu căi, a fost afișat un cache asociativ cu căi Un recenzent a declarat că cititorii ar putea fi confuzi de acest lucru, deoarece nu este o putere a doi, iar computerele fac totul în binar Deoarece consumatorul are întotdeauna dreptate, designul a fost schimbat într-un cache asociativ cu căi A avut dreptate recenzentul? Argument Un computer cu o conductă în cinci etape după procesarea unei ramuri condiționate este inactiv pentru următoarele trei cicluri Cât de mult va afecta această perioadă de nefuncționare dacă % dintre instrucțiuni sunt instrucțiuni de ramură condiționată? Alte motive pentru timpul de nefuncționare sunt ignorate Să presupunem că computerul apelează până la de comenzi în avans În medie, dintre acestea sunt instrucțiuni de ramură condiționată, fiecare cu o șansă de % de a prezice corect Care este probabilitatea ca comanda invocată anterior să fie pe una dintre căile corecte? Să presupunem că trebuie să schimbăm structura mașinii, prezentată folosind Tabelul pentru a folosi registre în loc de Apoi schimbăm instrucțiunea în registrul țintă R Ce se va întâmpla în acest caz în ciclurile începând cu ciclul ? Capitolul Nivel de microarhitectură Interdependențele fac de obicei dificile procesoarele pipeline Se poate face ceva în legătură cu dependențele WAW pentru a îmbunătăți lucrurile? Care sunt instrumentele de optimizare? Rescrieți interpretorul Mic- astfel încât registrul LV să indice prima variabilă locală, și nu către pointerul de legătură Scrieți un simulator pentru un cache cu cartografiere directă unică Faceți numărul de elemente și lungimea parametrilor șirului programului Experimentați cu acest program și prezentați rezultatele capitolul Stratul de arhitectură set de instrucțiuni Acest capitol discută în detaliu nivelul arhitecturii setului de instrucțiuni (ISA) După cum se arată în fig , este situat între nivelul microarhitecturii și cel al sistemului de operare Din punct de vedere istoric, acest nivel s-a dezvoltat înaintea tuturor celorlalte niveluri și a fost inițial singurul În zilele noastre, acest nivel este deseori denumit "arhitectura" mașinii și uneori (incorect) "limbajul de asamblare" Nivelul arhitecturii setului de instrucțiuni este de o importanță deosebită: este legătura dintre software și hardware Desigur, s-ar putea face ca hardware-ul să execute direct programe scrise în C, C++, Java sau alte limbaje de nivel înalt, dar aceasta nu este o idee bună Avantajul compilarii fata de interpretare s-ar pierde atunci În plus, din motive pur practice, computerele ar trebui să poată executa programe scrise în diferite limbi, nu doar una De fapt, toți dezvoltatorii consideră că este necesar să se traducă programele scrise în diferite limbi de nivel înalt într-o formă intermediară comună tuturor - nivelul de arhitectură a setului de instrucțiuni - și, în consecință, să construiască hardware care să poată executa direct programe la acest nivel Stratul de arhitectură a setului de instrucțiuni leagă compilatoare și hardware Este un limbaj pe care atât compilatorii, cât și dispozitivele îl înțeleg Pe fig Figura arată relația dintre compilatoare, nivelul arhitecturii setului de instrucțiuni și hardware Orez Stratul de arhitectură al setului de instrucțiuni este o legătură intermediară între compilatoare și hardware Capitolul Stratul de arhitectură al setului de instrucțiuni În mod ideal, atunci când construiesc o nouă mașină, arhitecții de instrucție ar trebui să se consulte atât cu compilatorul, cât și cu designerii hardware pentru a determina ce caracteristici ar trebui să aibă stratul lor Dacă dezvoltatorii compilatorului necesită o caracteristică pe care inginerii nu o pot implementa, atunci această idee nu va funcționa În același mod, dacă dezvoltatorii de hardware vor să introducă un element nou în computer, dar programatorii nu pot scrie programul pentru a-l susține, un astfel de proiect nu se va concretiza niciodată Nivelul de arhitectură rezultat al setului de instrucțiuni, optimizat pentru limbajele de programare dorite, este întotdeauna produsul multor discuții și modelări Dar toate acestea sunt în teorie Acum să trecem la realitatea dură Când apare o mașină nouă, prima întrebare pe care și-o pun toți potențialii cumpărători este: "Este mașina compatibilă cu versiunea inversă?" A doua întrebare este: "Pot rula vechiul sistem de operare pe el?" Și a treia întrebare: "Vor funcționa aplicațiile vechi pe această mașină și vor trebui înlocuite cu versiuni noi?" Dacă răspunsul la oricare dintre aceste întrebări este nu, dezvoltatorii trebuie să explice de ce Este puțin probabil ca clienții să vrea să-și arunce programele preferate pentru a începe de la capăt Acest fapt îi obligă pe producătorii de computere să mențină același nivel de instrucțiuni pe diferite modele sau cel puțin să-l facă compatibil cu invers Prin compatibilitate inversă, înțelegem capacitatea unei mașini noi de a rula programe vechi fără modificări În același timp, noua mașină poate accepta comenzi noi și poate avea alte caracteristici utilizate de noul software Dezvoltatorii trebuie să facă nivelul de comandă compatibil cu înapoi, dar sunt liberi să schimbe hardware-ul după bunul plac, deoarece aproape niciunuia dintre cumpărători îi pasă de ce sunt cu adevărat "interiorurile" computerului și ce anume face acest sau acel dispozitiv Dezvoltatorii pot trece de la firmware la utilizarea directă a dispozitivelor, pot adăuga conducte, pot implementa circuite superscalare și așa mai departe, dar cu condiția ca acestea să rămână compatibili cu nivelul de instrucțiuni al modelelor anterioare Scopul principal este să vă asigurați că programele vechi funcționează pe noua mașină Adică, sarcina iese în prim-plan nu doar de a crea mașini bune, ci de a crea mașini bune, cu condiția să fie compatibile cu invers Toate cele de mai sus nu scad de la importanța stratului de arhitectură a setului de instrucțiuni Nivelul de calitate al arhitecturii setului de instrucțiuni este extrem de important, mai ales în ceea ce privește capacitățile de calcul și costul Performanța mașinilor echivalente cu diferite niveluri de arhitectură a seturilor de instrucțiuni poate varia cu % Vrem doar să spunem că piața îngreunează într-o anumită măsură trecerea de la vechea arhitectură de echipă la cea nouă Cu toate acestea, uneori apar noi niveluri de instrucțiuni de uz general, iar pe piețele specializate (cum ar fi piața sistemelor încorporate sau piața procesoarelor multimedia), acestea apar mult mai frecvent Prin urmare, este important să înțelegeți cum funcționează acest nivel Prezentare generală a nivelului arhitecturii setului de instrucțiuni Ce este o arhitectură de comandă bună? Există doi factori principali În primul rând, o arhitectură bună ar trebui să ofere un set de comenzi care să poată fi implementate eficient nu numai în tehnologia modernă, ci și în tehnologia viitoare Cu o arhitectură de instrucțiuni prost proiectată, un procesor poate avea mai multe porți, programele pot necesita mai multă memorie pentru a rula și așa mai departe, un sistem cu o arhitectură de instrucțiuni și mai avansată poate În al doilea rând, o arhitectură de instrucțiuni bună ar trebui să ofere cea mai mare claritate despre exact ce ar trebui să fie programul compilat Regularitatea și completitudinea opțiunilor sunt caracteristici care nu sunt întotdeauna inerente arhitecturii echipelor Aceste trăsături sunt deosebit de importante pentru un compilator, care nu poate face întotdeauna cea mai bună alegere dintre mai multe alternative, mai ales dacă unele alternative aparent evidente nu sunt suportate de arhitectura de instrucțiuni Pe scurt, din moment ce stratul de arhitectură al setului de instrucțiuni este o legătură intermediară între hardware și software, ar trebui să fie acceptabil atât pentru dezvoltatorii hardware (în ceea ce privește implementarea eficientă), cât și pentru programatori (în ceea ce privește scrierea codului de calitate) Prezentare generală a nivelului arhitecturii setului de instrucțiuni Să începem studiul nostru asupra stratului arhitecturii setului de instrucțiuni întrebând ce este acesta Această întrebare poate părea simplă la prima vedere, dar de fapt există o mulțime de subtilități În următoarea subsecțiune, vom discuta unele dintre acestea și apoi ne vom uita la modelele de memorie, registru și instrucțiuni Set de instrucțiuni Proprietăți la nivel de arhitectură În principiu, nivelul arhitecturii setului de instrucțiuni este nivelul la care un computer este prezentat unui programator care scrie programe în limbajul mașinii Deoarece niciun programator normal nu scrie acum astfel de programe, am reelaborat ușor această definiție: un program la nivel de arhitectură de set de instrucțiuni este ceea ce rezultă din compilator (deocamdată ne vom ocupa de apelurile de sistem și limbajul de asamblare simbolic) Pentru a obține un program la nivel de arhitectură al setului de instrucțiuni, scriitorul compilatorului trebuie să știe ce model de memorie este utilizat în mașină, ce registre, tipuri de date și instrucțiuni sunt disponibile etc Toate aceste informații împreună determină nivelul arhitecturii setului de instrucțiuni În conformitate cu această definiție, întrebările despre dacă microarhitectura este accesibilă programatic, dacă computerul este pipeline, dacă este superscalar etc , nu aparțin nivelului de arhitectură al setului de instrucțiuni, deoarece Capitolul Stratul de arhitectură al setului de instrucțiuni dezvoltatorul compilatorului nu vede toate acestea Cu toate acestea, această remarcă nu este în întregime corectă, deoarece unele dintre aceste caracteristici afectează performanța, iar performanța, la rândul său, este un indicator care este destul de accesibil dezvoltatorului compilatorului Luați în considerare, de exemplu, o mașină superscalară care poate procesa instrucțiuni duble într-un ciclu, astfel încât o instrucțiune să fie întreagă, iar cealaltă să fie în virgulă mobilă Dacă instrucțiunile întregi și în virgulă mobilă sunt intercalate în codul rezultat din compilator, atunci performanța va crește considerabil Astfel, detaliile operației superscalare sunt disponibile la nivelul arhitecturii setului de instrucțiuni, adică granițele dintre diferitele niveluri sunt neclare Pentru unele arhitecturi, nivelul de instruire este definit printr-un document formal, de obicei emis de un consorțiu industrial, pentru altele nu este De exemplu, V SPARC (Versiunea SPARC) și sistemele JVM au definiții oficiale [ ] Scopul unei astfel de cărți albe este de a permite diferiților producători să producă mașini de acest tip, astfel încât aceste mașini să poată rula aceleași programe și să obțină aceleași rezultate În cazul sistemului SPARC, astfel de documente sunt necesare pentru ca întreprinderile diferite să poată produce cipuri SPARC identice care diferă unele de altele doar ca performanță și preț Pentru ca această idee să funcționeze, vânzătorii de cipuri trebuie să știe ce face un cip SPARC (la nivelul arhitecturii setului de instrucțiuni) Prin urmare, documentul vorbește despre ce este modelul de memorie, ce registre sunt, ce acțiuni efectuează instrucțiunile etc , și nu despre ce este microarhitectura Astfel de documente conțin secțiuni normative care stabilesc cerințele și secțiuni informative menite să ajute cititorul, dar nu fac parte din definiția formală În secțiunile normative se întâlnesc constant cuvinte care ar trebui, nu pot, ar trebui, adică o cerință, o interdicție și o recomandare De exemplu, următoarea propoziție înseamnă că, dacă un program execută un cod operațional care nu este definit, ar trebui să provoace o capcană, nu doar să fie ignorat: Executarea unui cod operațional rezervat trebuie să declanșeze o capcană Poate exista o abordare alternativă: Rezultatul executării unui cod operațional rezervat este definit de implementare Aceasta înseamnă că compilatorul compilatorului nu poate calcula nicio acțiune specifică, lăsând constructorilor liberi să aleagă Descrierile arhitecturii sunt adesea însoțite de pachete de testare pentru a verifica dacă implementarea îndeplinește de fapt specificația Este destul de clar de ce sistemul V SPARC vine cu un document care definește nivelul de arhitectură al setului de instrucțiuni - acest lucru este necesar pentru ca toate cipurile V SPARC să poată rula aceleași programe Prezentare generală a nivelului arhitecturii setului de instrucțiuni Noi Nu există un astfel de document pentru nivelul de arhitectură al setului de instrucțiuni al procesorului Pentium , deoarece Intel nu dorește ca alți producători să poată produce cipuri Pentium Intel a mers chiar în instanță pentru a interzice altor producători să-și producă cipurile, dar a pierdut proces O altă calitate importantă a stratului de arhitectură a setului de instrucțiuni este că majoritatea mașinilor acceptă cel puțin două moduri Sistemul de operare pornește în modul privilegiat Acest mod vă permite să executați toate comenzile Modul utilizator este destinat lansării de programe de aplicație Împiedică executarea unor comenzi potențial periculoase (de exemplu, cele care manipulează direct memoria cache) În acest capitol, ne vom concentra în primul rând pe comenzile și proprietățile modului utilizator Modele de memorie În toate computerele, memoria este împărțită în celule care au adrese secvențiale În prezent, cea mai comună dimensiune a celulei este de biți, dar în trecut erau folosite celule de la la de biți (vezi Tabelul ) O celulă de biți se numește octet Motivul pentru utilizarea celulelor de memorie de biți este caracterul ASCII, care ia biți, și împreună cu bitul de paritate - Dacă codarea UNI CODE domină în viitor, atunci celulele de memorie pot deveni pe biți În general, este mai bun decât deoarece este o putere a lui și nu este Octeții sunt de obicei grupați în cuvinte de octeți ( de biți) sau de octeți ( de biți) cu instrucțiuni de manipulare a cuvintelor întregi Multe arhitecturi necesită ca cuvintele să fie aliniate în limitele lor naturale Astfel, un cuvânt de octeți poate începe la adresa , , etc , dar nu la adresa sau În mod similar, un cuvânt de octeți poate începe la adresa , sau , dar nu la adresa sau Mecanismul de alocare a cuvintelor de octeți în memorie este ilustrat în fig Alinierea adreselor este necesară destul de des, deoarece este cea mai eficientă modalitate de utilizare a memoriei De exemplu, procesorul Pentium , care accesează octeți de memorie per acces, folosește adrese fizice de de biți, dar conține doar de biți de adresă Prin urmare, Pentium nici măcar nu va putea accesa memoria nealiniată, deoarece cei biți inferiori nu sunt definiți în mod explicit Acești biți sunt întotdeauna și toate adresele de memorie sunt multipli de octeți Cu toate acestea, cerința pentru alinierea adresei cauzează uneori unele probleme Pe procesorul Pentium , programele pot accesa cuvinte începând de la orice adresă, o calitate care se întoarce la cu o magistrală de date de octet care nu necesita ca celulele să se afle pe granițele de octeți Dacă un program din procesorul Pentium citește un cuvânt de octeți de la adresa , hardware-ul trebuie să facă un acces de memorie pentru a apela octeții de la la și un al doilea pentru a apela octeții de la la CPU-ul preia apoi cei octeți necesari din Capitolul Stratul de arhitectură al setului de instrucțiuni citește din memorie și le aranjează în ordinea corectă pentru a forma un cuvânt de octeți A Cuvânt aliniat de octeți la adresa celulei Abordare octeți ! și ta s yy yii! Nealiniat de octeți DESPRE cuvânt în celulă cu adresa b Orez Locația cuvântului de octeți în memorie: cuvânt(e) aliniat(e); cuvânt nealiniat (b) Unele mașini necesită ca cuvintele să fie aliniate în memorie Capacitatea de a citi cuvinte cu adrese arbitrare necesită complexitatea cipului, care devine apoi mai mare și mai scump Dezvoltatorii ar fi bucuroși să scape de un astfel de cip și ar cere pur și simplu ca toate programele să acceseze memoria cuvânt cu cuvânt, nu octet cu octet Cu toate acestea, la întrebarea tradițională a dezvoltatorilor: "Cine are nevoie de programe vechi scrise pentru mașini și complet greșit cu memoria?" - urmează răspunsul nu mai puțin tradițional al vânzătorilor: "Către cumpărătorii noștri" Majoritatea mașinilor au un singur spațiu de adrese liniar care merge de la adresa la un maxim, de obicei sau de octeți Unele mașini au spații de adrese separate pentru instrucțiuni și date, astfel încât un apel de instrucțiuni la adresa și un apel de date la adresa se referă la spații de adrese diferite Un astfel de sistem este mult mai complex decât un singur spațiu de adrese, dar are două avantaje În primul rând, cu aceleași adrese de de biți, devine posibil să aveți de octeți pentru programe și de octeți suplimentari pentru date În al doilea rând, deoarece scrierea are loc întotdeauna automat numai în spațiul de date, suprascrierea accidentală a programului devine imposibilă și, prin urmare, una dintre sursele erorilor de program este eliminată Rețineți că spațiile separate pentru instrucțiuni și adrese de date nu sunt aceleași cu un cache L partajat In primul caz Prezentare generală a nivelului arhitecturii setului de instrucțiuni întregul spațiu de adrese este duplicat, iar citirea de la orice adresă produce rezultate diferite, în funcție de faptul că este un cuvânt de date sau o comandă citită Cu un cache divizat, există un singur spațiu de adrese, doar că diferite părți ale acestui spațiu sunt stocate în diferite blocuri cache Un alt aspect al modelului memoriei este semantica memoriei Este firesc să ne așteptăm ca instrucțiunea LOAD, dacă este executată după instrucțiunea STORE, să se refere la aceeași adresă și să returneze valoarea doar stocată Totuși, așa cum am văzut în Capitolul , microinstrucțiunile sunt reordonate pe multe mașini Astfel, există un pericol real ca memoria să nu funcționeze conform așteptărilor Situația devine mai complicată în prezența unui multiprocesor, când fiecare procesor trimite un flux de cereri de citire și scriere în memoria partajată, iar aceste solicitări pot fi și reordonate Dezvoltatorii de sisteme pot adopta una dintre mai multe abordări pentru a rezolva această problemă Pe de o parte, toate cererile de memorie pot fi ordonate în așa fel încât fiecare să fie finalizată înainte de a începe următoarea O astfel de strategie are un efect negativ asupra performanței, dar oferă cea mai simplă semantică a memoriei (toate operațiunile sunt efectuate strict în ordinea în care sunt localizate în program) Pe de altă parte, nu puteți face deloc garanții cu privire la ordonarea solicitărilor de memorie, iar pentru a realiza această ordonare, programul emite o comandă SYNC, care blochează începerea tuturor operațiunilor noi de memorie până la finalizarea celor anterioare Această idee îl face foarte dificil pentru dezvoltatorii de compilatoare, deoarece trebuie să înțeleagă cu atenție cum funcționează microarhitectura corespunzătoare, dar designerilor de hardware li se oferă libertate deplină în ceea ce privește optimizarea utilizării memoriei De asemenea, sunt posibile modele de memorie intermediară, în care hardware-ul blochează automat anumite operațiuni de memorie (cum ar fi cele asociate cu dependențele RAW și WAR) de la pornire, în timp ce nu blochează pornirea tuturor celorlalte operațiuni Deși implementarea acestor caracteristici la nivelul arhitecturii setului de instrucțiuni este destul de plictisitoare (cel puțin pentru scriitorii de compilatori și programatorii de limbaje de asamblare), există acum o tendință notabilă către prevalența acestei abordări Această tendință este determinată de evoluții precum mecanismele de reordonare a microinstrucțiunilor, conductele, cache-urile pe mai multe niveluri și așa mai departe Alte exemple mai puțin cunoscute de acest gen vor fi discutate mai târziu în acest capitol Registrele Toate computerele au mai multe registre disponibile la nivelul arhitecturii setului de instrucțiuni Acestea vă permit să controlați execuția programului, să stocați rezultate temporare și să servească și pentru alte scopuri În general, registrele disponibile la nivel de microarhitectură, cum ar fi TOS și MAR (vezi Figura ), nu sunt disponibile la nivelul arhitecturii setului de instrucțiuni, dar unele registre, cum ar fi contorul de program și pointerul stivei, sunt disponibile la nivelul setului de instrucțiuni Capitolul Stratul de arhitectură al setului de instrucțiuni ambele niveluri În același timp, registrele disponibile la nivelul arhitecturii setului de instrucțiuni sunt întotdeauna disponibile la nivel de microarhitectură, deoarece acolo sunt implementate Registrele de nivel de arhitectură setului de instrucțiuni pot fi împărțite în două categorii: registre speciale și registre de uz general Registrele speciale includ contorul de programe și indicatorul de stivă, precum și alte registre care au funcții speciale Registrele de uz general conțin variabile locale cheie și rezultate intermediare ale calculelor Funcția lor principală este de a oferi acces rapid la datele utilizate frecvent (de obicei fără acces la memorie) Mașinile RISC cu procesoare de mare viteză și memorie (relativ) lentă conțin de obicei cel puțin de registre de uz general, numărul de registre de uz general crescând constant la procesoare noi În unele mașini, registrele de uz general sunt complet simetrice și interschimbabile Dacă toate registrele sunt echivalente, compilatorul poate folosi atât registrul R , cât și registrul R pentru a stoca rezultatul intermediar Alegerea registrului nu contează Pe alte mașini, unele registre de uz general pot fi specializate De exemplu, procesorul Pentium are un registru EDX care poate fi folosit ca registru de uz general, dar care este folosit și pentru rezolvarea unor sarcini foarte specifice (obține jumătate din produs la înmulțire și jumătate din dividend la împărțire) Chiar dacă registrele de uz general sunt complet interschimbabile, sistemul de operare sau compilatoarele respectă adesea convențiile cu privire la modul de utilizare a acestor registre De exemplu, unele registre ar putea fi folosite pentru a stoca parametrii procedurilor apelate, în timp ce altele ar putea fi folosite ca registre temporare Dacă compilatorul plasează o variabilă locală importantă în registrul R și apoi apelează o procedură de bibliotecă care tratează R ca pe un registru alocat temporar acestuia, gunoiul poate fi lăsat în registrul R după ce procedura returnează o valoare Adică, dacă există convenții de sistem privind modul în care ar trebui să fie utilizate registrele, scriitorii de compilatori și programatorii de asamblare trebuie să le respecte Pe lângă registrele disponibile la nivelul arhitecturii setului de instrucțiuni, există întotdeauna destul de puține registre speciale disponibile doar în modul privilegiat Aceste registre controlează diverse blocuri cache, memoria principală, dispozitivele I/O și alte dispozitive ale mașinii Aceste registre sunt utilizate numai de sistemul de operare, astfel încât compilatorii și utilizatorii nu trebuie să fie conștienți de existența lor Există un registru care este un "hibrid" care este disponibil atât în modul privilegiat, cât și în modul utilizator Acesta este registrul PSW (Program State Word) menționat în capitolul , care se mai numește și registrul flag Registrul flag conține diferiți biți necesari CPU Cei mai importanți biți sunt codurile de stare Ele sunt setate în fiecare ciclu ALU și reflectă starea rezultatului operației anterioare: Prezentare generală a nivelului arhitecturii setului de instrucțiuni ♦ N - rezultatul este negativ (Negativ); ♦ Z - rezultatul este (Zero); ♦ V - rezultatul a provocat un overflow (oVerflow); ♦ С - transferul bitului din stânga (Capu out); ♦ A - bit carry (Auxiliary carry - service carry); ♦ R - rezultatul este par (Paritate) Codurile de condiție sunt foarte importante deoarece sunt folosite în comparații și salturi condiționate De exemplu, instrucțiunea CMP scade de obicei un operand din altul și setează codurile de condiție pe baza diferenței Dacă operanzii sunt egali, diferența va fi și bitul Z va fi setat în registrul flag Instrucțiunea ulterioară BEQ (Branch Equal) verifică bitul Z și sare dacă este setat Registrul de steag poate stoca mai mult decât coduri de stare Conținutul acestuia poate varia de la o mașină la alta Câmpurile suplimentare indică modul mașinii (de exemplu, utilizator sau privilegiat), bit de urmărire (care este utilizat pentru depanare), nivelul de prioritate a procesorului, starea de activare a întreruperii Registrul steag este de obicei citit în modul utilizator, dar unele câmpuri pot fi scrise doar în modul privilegiat (de exemplu, bitul care specifică modul) Echipe Principala caracteristică a nivelului pe care îl luăm în considerare acum este un set de instrucțiuni ale mașinii Ei controlează acțiunile mașinii În acest set, există întotdeauna într-o formă sau alta comenzile LOAD și STORE menite să mute date între memorie și registre și comanda MOVE, care servește la copierea datelor dintr-un registru în altul De asemenea, există întotdeauna comenzi aritmetice și logice, comenzi pentru compararea elementelor de date și comenzi de salt în funcție de rezultate Câteva comenzi tipice au fost deja discutate în Capitolul (vezi Tabelul ), iar în acest capitol vom fi prezentate multe altele În acest capitol, vom discuta trei arhitecturi de instrucțiuni foarte diferite: Intel IA- (găsit în Pentium ), versiunea SPARC (găsită în procesoarele UltraSPARC) și Nu este intenția noastră să oferim o descriere exhaustivă a fiecare dintre aceste arhitecturi Vrem doar să demonstrăm aspecte importante ale arhitecturii de comandă și să arătăm cum se schimbă aceste aspecte de la o arhitectură la alta Să începem cu aparatul Pentium Prezentare generală a nivelului arhitecturii setului de instrucțiuni Pentium Procesorul Pentium a evoluat de-a lungul anilor După cum s-a menționat în Capitolul , istoria sa merge înapoi la cele mai vechi microprocesoare Arhitectura de bază a instrucțiunilor permite executarea programelor scrise pentru Capitolul Stratul de arhitectură al setului de instrucțiuni Procesoare și (care au aceeași arhitectură de instrucțiuni) și parțial chiar și pentru , un procesor pe biți care a fost popular în anii , la rândul său, a fost puternic influențat de cerințele de compatibilitate cu procesorul , care se baza pe procesorul (un cip pe biți datând din epoca de piatră) Din punct de vedere software, computerele și erau pe biți (deși computerul conținea o magistrală de date pe biți) Succesorul lor, , era, de asemenea, pe biți Principalul său avantaj a fost un spațiu de adrese mai mare, deși foarte puține programe l-au folosit pentru că era format din de segmente de de kiloocteți, mai degrabă decât din memorie liniară de de octeți Procesorul a fost prima mașină pe de biți lansată de Intel Toate procesoarele ulterioare ( , Pentium, Pentium Pro, Pentium II, Pentium III, Pentium , Celeron, Cheop, Pentium M, Centrino etc ) au exact aceeași arhitectură pe de biți numită IA- , așa că ne vom concentra atenție asupra acestei arhitecturi Singura schimbare semnificativă de arhitectură de la a fost introducerea instrucțiunilor MMX în versiunile ulterioare ale Pentium Aceste comenzi îndeplinesc o funcție foarte specifică - îmbunătățesc performanța aplicațiilor multimedia Pentium are moduri de operare, din care două se comportă ca un În modul real, toate caracteristicile cu care a fost dotat procesorul de la sunt dezactivate, iar Pentium funcționează ca un simplu procesor A eroarea software provoacă o defecțiune completă a sistemului Dacă Intel ar dezvolta ființe umane, atunci cu siguranță s-ar pune un pic special în interiorul fiecărei astfel de creaturi, readucerea unei persoane la modul de funcționare al strămoșilor săi (creier primitiv, lipsă de vorbire, viață în copaci, o dietă pur cu banane etc ) Următorul pas este modul procesor virtual , care face posibilă rularea programelor vechi scrise pentru , dar cu protecție Pentru a rula vechiul program , sistemul de operare creează un mediu izolat special care acționează ca procesorul , cu excepția faptului că, atunci când are loc o defecțiune a software-ului, informațiile corespunzătoare sunt transferate sistemului de operare, iar sistemul nu se blochează complet Când un utilizator de Windows deschide o fereastră MS-DOS, programul care rulează în acea fereastră rulează în modul procesor virtual , ceea ce ajută la protejarea Windows de posibilele libertăți ale programelor DOS Ultimul mod este modul protejat, în care Pentium se comportă ca un Pentium , nu ca un În acest mod, sunt disponibile niveluri de privilegii, setate de biți în registrul flag (PSW) Nivelul corespunde modului privilegiat pe alte computere și oferă acces complet la mașină Acest nivel este utilizat de sistemul de operare Nivelul este pentru programele utilizatorului La acest nivel, accesul la anumite comenzi și registre de control este blocat, astfel încât eșecul unui program utilizator să nu conducă la prăbușirea întregului sistem Nivelurile și sunt rar utilizate Prezentare generală a nivelului arhitecturii setului de instrucțiuni Pentium are un spațiu de adrese uriaș Memoria este împărțită în de segmente, fiecare ocupând adrese de la la - Cu toate acestea, majoritatea sistemelor de operare (inclusiv UNIX și toate versiunile de Windows) acceptă doar un singur segment, astfel încât un spațiu de adrese liniar de de octeți este de obicei disponibil pentru programele de aplicație , uneori o parte din acest spațiu este ocupată de sistemul de operare în sine Fiecare octet din spațiul de adrese are propria sa adresă Cuvintele au de biți Octeții sunt numerotați de la dreapta la stânga (adică prima adresă corespunde octetului cel mai puțin semnificativ) Registrele procesorului Pentium sunt prezentate în fig Primele patru registre, EAX, EBX, ECX și EDX, sunt pe de biți Acestea sunt registre de uz general, deși fiecare dintre ele are anumite caracteristici EAX - registru aritmetic de bază; EBX este conceput pentru a stoca pointeri (adrese de memorie); ECX este despre ciclism; EDX este necesar pentru înmulțire și împărțire - acest registru, împreună cu EAX, conține produse și dividende pe de biți EIR steaguri Orez Principalele registre ale procesorului Pentium Capitolul Stratul de arhitectură al setului de instrucțiuni Cei și biți inferiori din fiecare dintre registrele considerate sunt registre independente de și, respectiv, biți, permițându-vă să manipulați cu ușurință valorile de și biți În calculatoarele și există doar registre de și biți, registrele de de biți au apărut în sistemul împreună cu prefixul E (Extended - extins) Următoarele trei registre sunt și registre de uz general, dar cu un grad mai mare de specializare Registrele ESI și EDI sunt concepute pentru a stoca pointeri și sunt concentrate în principal pe suport hardware pentru comenzile șir: ESI indică șirul sursă, EDI către șirul țintă Registrul EVR este, de asemenea, proiectat pentru a stoca pointeri și este de obicei folosit pentru a indica baza cadrului variabil local curent, la fel ca registrul LV din mașina IJVM Un astfel de registru este denumit în mod obișnuit indicator de cadru În cele din urmă, registrul ESP este indicatorul stivei Următorul grup de registre de la CS la GS sunt registre de segment Acestea sunt trilobiți electronici - atavisme rămase de la procesorul , care avea de octeți de memorie disponibili prin adrese pe biți Este suficient să spunem că atunci când Pentium rulează în modul de spațiu de adresă liniar unic de de biți, acestea pot fi ignorate în siguranță Registrul EIP (Extended Instruction Pointer) este un contor de program Registrul EFLAGS este un registru steag Prezentare generală a nivelului arhitecturii setului de instrucțiuni UltraSPARC III Arhitectura SPARC a fost introdusă pentru prima dată în de Sun Micro-systems Această arhitectură a devenit una dintre primele arhitecturi industriale RISC Sa bazat pe un studiu efectuat la Berkeley în anii [ , ] Arhitectura SPARC a fost inițial pe de biți, dar UltraSPARC III este o mașină pe de biți bazată pe arhitectura SPARC Versiunea și asta vom descrie în acest capitol Pentru coerență cu restul acestei cărți, ne vom referi la acest sistem ca UltraSPARC III, deși la nivelul arhitecturii setului de instrucțiuni, toate mașinile UltraSPARC sunt identice Structura de memorie a mașinii UltraSPARC III este foarte simplă - o matrice liniară de de octeți În prezent, nu este posibilă implementarea deoarece memoria este prea mare ( octeți) Implementările actuale au o limită a dimensiunii spațiului de adrese pe care îl pot accesa ( de octeți pentru UltraSPARC III), dar acest număr va crește în viitor Octeții sunt numerotați de la stânga la dreapta, dar puteți comuta la numerotarea de la dreapta la stânga setând unul dintre biții din registrul de steag Este important ca limita de octeți adresabili să fie mai mare decât ceea ce este necesar pentru implementarea arhitecturii de instrucțiuni, deoarece în viitor este probabil ca cantitatea de memorie care poate fi accesată de procesor va trebui să fie mărită Una dintre cele mai mari probleme este că arhitectura de instrucțiuni limitează dimensiunea memoriei adresabile Aceasta este o manifestare a unei probleme globale de informare (nu sunt întotdeauna destui biți disponibili), care probabil nu va fi rezolvată Prezentare generală a nivelului arhitecturii setului de instrucțiuni nu Într-o zi, nepoții noștri se vor întreba cum ar putea funcționa computerele cu adrese de doar de biți și GB de memorie Arhitectura de instrucțiuni SPARC este destul de simplă, deși organizarea registrului a fost ușor complicată pentru a face apelurile de procedură mai eficiente Practica arată că organizarea registrelor necesită mult efort și, deși acest efort de obicei nu merită, regula de compatibilitate nu vă permite să-l refuzați Sistemul UltraSPARC III are două grupuri de registre: de registre de uz general pe de biți și de registre în virgulă mobilă Registrele de uz general se numesc R -R , dar alte denumiri sunt folosite în anumite contexte Variantele denumirilor registrelor și funcțiile acestora sunt date în tabel Tabelul - -Registre de uz general UltraSPARC III Înregistrare Nume alternativ Scop R G Hardware zero Ceea ce este stocat în acest registru este pur și simplu ignorat R -R G -G Conțin variabile globale R -R - Conține parametrii procedurii apelate R SP Stack Pointer R Registrul temporar R -R L -L Conține variabile locale pentru procedura curentă R -R I -I Conțin parametrii de intrare R FP Indicator la baza cadrului stivei curente R I Conține adresa de retur pentru procedura curentă Toate registrele de uz general sunt pe de biți Toate acestea, cu excepția R , care este întotdeauna zero, pot fi citite și scrise folosind diverse comenzi de încărcare și stocare Scopul acestor registre, prezentat în tabel , parțial determinat prin convenție, parțial dependent de hardware-ul utilizat În general, totuși, nu ar trebui să vă abateți de la această misiune decât dacă sunteți un expert în calculatoarele SPARC Programatorul trebuie să se asigure că programul accesează corect registrele și efectuează operații aritmetice valide cu acestea De exemplu, este foarte ușor să încărcați numere în virgulă mobilă în registre de uz general și apoi să efectuați adunarea întregilor asupra lor, operație care va avea ca rezultat o prostie completă, dar pe care CPU-ul o va face cu siguranță dacă programul o cere Variabilele globale sunt folosite pentru a stoca constante, variabile și pointeri care sunt necesare în toate procedurile, deși pot fi încărcate și reîncărcate după cum este necesar la intrarea și ieșirea din procedură Registrele Ix și Ox sunt folosite pentru a transmite parametri la proceduri pentru a evita accesul la memorie În continuare, vom descrie cum se întâmplă acest lucru Capitolul Stratul de arhitectură al setului de instrucțiuni Registrele speciale sunt folosite în scopuri speciale Registrele FP și SP limitează cadrul curent Primul indică la baza cadrului curent și este folosit pentru a accesa variabilele locale, la fel ca LV din Fig Al doilea indică spre partea de sus a stivei și se schimbă atunci când cuvintele sunt împinse sau scoase din stivă Valoarea registrului FP este modificată numai atunci când procedura este apelată și terminată Al treilea registru special este R Conține adresa de retur pentru procedura curentă R R R R R R R R R R R R R G , ' R ,G Registrul global Registrul global G R Registrul global G R R R SP Stack Pointer Redenumirea R Registrul provizoriu R |Y| Registrul local CWP= R L Registrul local RO Parametru de ieșire R IO Parametru de intrare OS Out Parametru SP Stack Pointer Suprapunere R R I , FP, Input Parameter Frame Pointer , Registrul temporar R І Adresa expeditorului L Registrul local O parte din fereastra anterioară CWP L , Registrul local ' n) merge la L ; primul operator; ultimul operator; = + ; dus la LI; L : Luați în considerare codul pe care compilatorul îl va genera atunci când procesează următoarea linie: pentru ( = ; (verificând, de exemplu, ce valoare este atribuită lui n), poate folosi codul mai eficient prezentat în Listarea Standardul limbajului FORTRAN a cerut odată ca toate buclele să fie executate cel puțin o dată Acest lucru ne-a permis să generăm întotdeauna cod mai eficient (ca în Listarea ) În , acest defect a fost corectat, deoarece până și adepții FORTRAN au început să realizeze că nu era foarte bine să existe o declarație de buclă cu o semantică atât de ciudată, deși salvează o instrucțiune de salt pe buclă Comenzi I/O Niciun alt grup de instrucțiuni nu variază în funcție de mașină la fel de mult ca instrucțiunile I/O Calculatoarele personale moderne folosesc trei scheme I/O diferite: ♦ I/O programabil cu așteptare activă; ♦ I/O cu control întrerupere; ♦ I/O cu acces direct la memorie Vom analiza pe rând fiecare dintre aceste scheme Cea mai simplă metodă I/O este I/O programabilă Această schemă este adesea folosită în microprocesoarele cu costuri reduse, cum ar fi sistemele încorporate sau sistemele care trebuie să răspundă rapid la schimbările externe (sisteme în timp real) Astfel de procesoare au de obicei o instrucțiune de intrare și o instrucțiune de ieșire Fiecare dintre aceste comenzi selectează unul dintre dispozitivele I/O Un caracter este transferat între un registru de procesor fix și dispozitivul I/O selectat Procesorul trebuie să execute o anumită secvență de instrucțiuni de fiecare dată când citește și scrie un caracter Ca exemplu, luați în considerare un terminal cu patru registre de octet, așa cum se arată în Fig Pentru introducere sunt utilizate două registre: registrul de stare a dispozitivului și registrul de date Pentru ieșire sunt utilizate două registre: Capitolul Stratul de arhitectură al setului de instrucțiuni de asemenea, un registru de stare a dispozitivului și un registru de date Fiecare dintre ele are o adresă unică Dacă există I/O mapate în memorie, toate cele registre fac parte din spațiul de adrese și pot fi citite și scrise folosind instrucțiunile normale de memorie În caz contrar, citirea și scrierea registrelor necesită instrucțiuni speciale I/O, cum ar fi IN și OUT În ambele cazuri, I/O se realizează prin transferul de date și informații despre starea dispozitivului între CPU și registrele specificate Bit de prezență a caracterului tampon Gata să primească următorul bit de caracter Stare tastatură / Afișează starea Activați întreruperile Activați întreruperile Buffer de tastatură Simbol primit Afișare buffer Caracter de afișat Orez Dispozitivul se înregistrează într-un terminal simplu Sunt utilizați doar din cei biți din registrul de stare a tastaturii Bitul din stânga este setat de hardware ori de câte ori apare un caracter în buffer-ul tastaturii Dacă bitul a fost setat anterior de software, se execută o întrerupere În caz contrar, nu apare nicio întrerupere În I/O programabile, pentru a primi date de intrare, CPU citește de obicei registrul de stare a tastaturii periodic într-o buclă până când bitul este setat la Când se întâmplă acest lucru, registrul tampon al tastaturii este citit programatic pentru a obține un caracter Citirea registrului de date face ca bitul de caracter prezent să fie șters Concluzia se face într-un mod similar Pentru a afișa un caracter pe ecran, registrul de stare de afișare este mai întâi citit de software pentru a vedea dacă bitul de pregătire este setat Dacă nu este setat, bucla este executată din nou și din nou până când bitul gata devine unul Aceasta va indica faptul că dispozitivul este pregătit să accepte caracterul Odată ce terminalul este în starea de pregătire, caracterul este scris în registrul tampon al afișajului în software, care afișează caracterul pe ecran și indică dispozitivului să resetați bitul pregătit în registrul de stare a afișajului Când un caracter apare pe ecran și terminalul se pregătește să proceseze următorul caracter, controlerul setează din nou bitul gata Ca exemplu de I/O programabil, luați în considerare procedura Java (Listarea ) Această procedură este apelată cu doi parametri: o matrice de caractere de tipărit și numărul de caractere din matrice (până la un kilobit) Corpul procedurii este o buclă care scoate câte un caracter la un moment dat În primul rând, procesorul central așteaptă ca dispozitivul să fie gata și numai după aceea scoate un caracter și această secvență de acțiuni Tipuri de comenzi Acțiunea se repetă pentru fiecare personaj Rutinele ip și out sunt rutine tipice de asamblare pentru citirea și scrierea registrelor dispozitivului, care sunt definite de primul parametru Variabila din care să citiți sau să scrieți este determinată de al doilea parametru Împărțirea la (prin deplasarea la dreapta cu biți) elimină cei biți inferiori, lăsând bitul gata la bitul zero Lista Exemplu I/O programabil public static void output buffer( nt buf[], Int count) { // Ieșire bloc de date către dispozitiv stare int, gata; pentru ( = ; la SP -> k= Valoare FP veche = Valoare FP veche = Adresa de retur Adresa de retur j= j= I= i= FP n= FP n= SP ► la k= k= k= Adresă de returnare FP valoare veche = FP valoare veche = FP valoare veche = Valoare veche FP = Adresa de retur Adresa de retur Adresa de retur j= І= j= j= І= І= i= i= FP -> n= n= n= n= SP-K k k = k = k = k = Valoare FP veche Valoare FP veche Valoare FP veche Valoare FP veche Valoare FP veche Adresa de retur Adresa de retur Adresa de retur Adresa de retur Adresa de retur j= i= j= j= j= І= І= І= i= i= FP -► n= n= > n= ► n= > n= A b c d Orez Starea stivei în timpul execuției programului din lista Capitolul Stratul de arhitectură al setului de instrucțiuni Primul lucru pe care ar trebui să-l facă procedura după apel este să salveze valoarea anterioară a FP (astfel încât să poată fi restabilită atunci când procedura iese), să copieze valoarea lui SP în FP și, eventual, să mărească SP cu un cuvânt, în funcție de locul în care se află punctele FP ale noului cadru În acest exemplu, FP indică către prima variabilă locală (deși în IJVM registrul LV a indicat indicatorul de legătură) Diferite mașini manipulează indicatorul de cadru ușor diferit, uneori plasându-l chiar în partea de jos a cadrului stivei, alteori în partea de sus și alteori la mijloc, ca în Fig În acest sens, merită să comparăm Fig cu fig pentru două moduri diferite de a trata un pointer de legătură Alte moduri sunt posibile Dar, în orice caz, trebuie să fie posibilă ieșirea din procedură și restabilirea stării anterioare a stivei Codul care păstrează vechiul indicator de cadru, setează noul indicator de cadru și incrementează indicatorul de stivă pentru a rezerva spațiu pentru variabilele locale se numește prolog de procedură La ieșirea din procedură, stiva trebuie golită, iar această sarcină este rezolvată în epilogul procedurii Una dintre cele mai importante caracteristici ale unui computer este cât de repede poate rula prologul și epilogul Daca sunt foarte lungi si ruleaza incet, nu este profitabil sa apelezi la proceduri Comenzile ENTER și LEAVE din Pentium au fost concepute special pentru a face ca prologurile și epilogurile procedurilor să funcționeze eficient Desigur, ele acceptă un anumit model de gestionare a indicatorului de cadru, iar dacă compilatorul acceptă un alt model, aceste comenzi nu pot fi utilizate Acum înapoi la Turnul din Hanoi Fiecare apel de procedură adaugă un nou cadru la stivă, iar fiecare ieșire de procedură elimină un cadru din stivă Să vedem cum se folosește stiva la implementarea procedurilor recursive și să începem prin a apela turnuri ( , , ) Pe fig a arată starea stivei imediat după apelul procedurii În primul rând, procedura verifică dacă n este egal cu unu și, după ce se stabilește că n = , completează k și efectuează un apel turnuri ( , , ) Starea stivei după finalizarea acestui apel este prezentată în Fig b Apoi procedura este executată din nou (procedura apelată începe întotdeauna de la început) De data aceasta condiția n = eșuează din nou, așa că procedura completează din nou k și apelează turnuri ( , , ) Starea stivei după acest apel este prezentată în Fig , c Contorul programului indică începutul procedurii De data aceasta, condiția este adevărată și pe ecran este afișat un șir Apoi se iese din procedura Pentru a face acest lucru, un cadru este șters și valorile FP și SP sunt redefinite (Fig , d) Procedura continuă de la adresa de retur: turnuri ( , , ) Acest apel împinge un nou cadru pe stivă (Figura , ) Se imprimă o altă linie După încheierea procedurii, cadrul este scos din stivă Apeluri de procedură Controlul fluxului continuă până la finalizarea execuției primei proceduri și până la cadrul prezentat în Fig , de asemenea, nu va fi scos din stivă Pentru a înțelege mai bine cum funcționează recursiunea, este necesar, folosind doar un pix și hârtie, să reproducem complet execuția procedurii turnuri ( ) Coroutine Într-o secvență normală de apel, există o diferență evidentă între procedura de apelare și procedura apelată Luați în considerare procedura A, care numește procedura B (Figura ) Apelant Callee Orez Executarea unei proceduri apelate începe întotdeauna de la începutul acesteia Capitolul Stratul de arhitectură al setului de instrucțiuni Procedura B rulează o perioadă, apoi revine la A La prima vedere, aceste situații pot părea simetrice, deoarece nici A, nici B nu sunt programe principale - sunt proceduri (deși procedura A ar putea fi numită program principal dacă se dorește, în acest caz este gresit) Mai mult, controlul este mai întâi transferat de la A la B (la apel), apoi de la B la A (la întoarcere) Diferența este că atunci când controlul trece de la A la B, procedura B începe de la început; iar când controlul este transferat de la B înapoi la A, execuția procedurii A nu continuă de la început, ci din momentul urmat de apelarea la procedura B Dacă A rulează o perioadă, apoi apelează din nou procedura B, execuția din B începe din nou de la început, nu din punctul în care controlul a fost returnat la procedura A Dacă procedura A apelează procedura B de multe ori, procedura B începe de la început de fiecare dată, iar procedura A nu începe niciodată de la început Această diferență se reflectă în modul în care controlul este transferat între A și B Când procedura A îl apelează pe B, folosește o instrucțiune de apel de procedură care plasează adresa de retur (adică adresa instrucțiunii care urmează procedura din program) în un loc unde va fi apoi va fi ușor de extras, de exemplu, în partea de sus a stivei Apoi introduce adresa procedurii B în contorul de programe pentru a finaliza apelul Pentru a ieși din procedura B, instrucțiunea de apel de procedură nu este folosită, ci instrucțiunea de ieșire a procedurii, care pur și simplu scoate adresa de retur din stivă și o pune în contorul de programe Cu toate acestea, uneori doriți ca ambele proceduri (A și B) să se apeleze reciproc ca procedură, așa cum se arată în Figura La întoarcerea de la B la A, procedura B sare la instrucțiunea precedată de apelul la procedura B Când procedura A transferă controlul către procedura B, aceasta nu revine chiar la începutul lui B (cu excepția primei oară), ci la loc înaintea căruia a avut loc un apel anterior către A Două proceduri care funcționează în acest fel se numesc coroutine Coroutinele sunt de obicei folosite pentru procesarea paralelă a datelor pe un singur procesor Fiecare corutine functioneaza parca simultan cu alte corutine, ca si cum ar avea propriul procesor Această abordare simplifică programarea unor aplicații De asemenea, este util pentru testarea software-ului conceput pentru multiprocesor Comenzile obișnuite CALL și RETURN nu sunt potrivite pentru apelarea corutinelor, deoarece, deși adresa de salt este luată din stivă, ca și în cazul controlului de retur, dar spre deosebire de controlul de retur, la apelarea unei corutine, adresa de retur este plasată într-un anumit loc în ordine pentru a reveni la el mai târziu Ar fi bine dacă ar exista o instrucțiune care să folosească un contor de program în loc de partea de sus a stivei Această instrucțiune trebuie să scoată mai întâi vechea adresă de retur de pe stivă și să o împingă într-un registru intern, apoi să împingă contorul de program pe stivă și, în sfârșit, să copieze conținutul registrului intern în contorul de programe Deoarece un cuvânt este scos din stivă și altul este împins pe stivă, starea indicatorului de stivă nu se schimbă O astfel de comandă este foarte rară, așa că în majoritatea cazurilor trebuie modelată din mai multe comenzi Controlul fluxului Procedura A este apelată din programul principal Procedura A readuce controlul programului principal a b Orez După terminarea corutinei, execuția începe de unde a rămas ultima dată, nu de la început Prinderea de excepții Captarea excepțiilor este un tip special de apel de procedură care are loc în anumite condiții, de obicei foarte grave, dar rare Un exemplu de astfel de condiție este preaplinul Pe majoritatea procesoarelor, dacă rezultatul unei operații aritmetice depășește cel mai mare număr permis, apare o excepție și este prinsă Aceasta înseamnă că fluxul de control merge într-o locație fixă de memorie și nu continuă secvenţial mai departe Această celulă fixă conține o comandă pentru a trece la o procedură specială (manager de excepții) care efectuează o anumită acțiune, cum ar fi imprimarea unui mesaj de eroare Dacă rezultatul operației este în intervalul permis, nu apare nicio excepție Important este că excepțiile pot fi aruncate în software și sunt prinse în hardware sau la nivel de firmware Pe lângă identificarea unei excepții, există o altă modalitate de a determina dacă a avut loc o depășire Pentru a face acest lucru, trebuie să aveți un registru de bit care va fi setat ori de câte ori are loc o depășire În acest caz, programatorul care ar dori Capitolul Stratul de arhitectură al setului de instrucțiuni pentru a verifica rezultatul pentru depășire, după fiecare comandă aritmetică, ar trebui să includă o comandă de salt de depășire în program, ceea ce este foarte incomod Adică, în comparație cu verificarea programatică explicită, capturarea excepțiilor economisește timp și memorie Captarea excepțiilor poate fi implementată nu numai în hardware, ci și cu ajutorul firmware-ului prin aceeași verificare explicită În acest caz, atunci când este detectată o depășire, adresa de gestionare a excepțiilor este încărcată în contorul programului Verificarea la nivel de firmware durează mai puțin timp decât verificarea la nivel de program, deoarece poate fi efectuată în același timp cu o altă acțiune În plus, o astfel de verificare economisește memorie, deoarece poate fi implementată doar într-un singur loc, de exemplu, în bucla principală a firmware-ului, indiferent de câte instrucțiuni aritmetice există în programul principal Cele mai frecvente condiții care pot provoca excepții includ: depășirea și dispariția cifrelor semnificative în timpul operațiunilor cu virgulă mobilă, depășirea în timpul operațiunilor cu numere întregi, încălcări de securitate, cod operațional nedefinit, depășire a stivei, pornirea unui dispozitiv I/O inexistent, apel adresa impară cuvinte, împărțire la întreruperi Întreruperile sunt modificări ale fluxului de control care nu sunt cauzate de programul în sine, ci de altceva De obicei, întreruperile sunt asociate cu procesul I/O De exemplu, un program poate instrui discul să înceapă transferul de informații și să declanșeze o întrerupere de îndată ce transferul este complet Ca și în cazul excepțiilor, întreruperile opresc programul și transferă controlul către o rutină a serviciului de întrerupere (ISR) sau către un handler de întreruperi, care efectuează anumite acțiuni După finalizarea acestor acțiuni, operatorul de întrerupere transferă controlul programului întrerupt Trebuie să repornească procesul întrerupt în aceeași stare în care era atunci când a fost întrerupt Aceasta înseamnă că starea anterioară a tuturor registrelor interne (adică starea care era înainte de întrerupere) trebuie restabilită Diferența dintre excepții și întreruperi este că excepțiile sunt sincrone cu programul, în timp ce întreruperile sunt asincrone Dacă programul este repornit de mai multe ori cu aceleași date de intrare, excepții vor apărea de fiecare dată în aceleași locuri din program, dar întreruperile nu vor apărea (în exemplul nostru cu un disc, o întrerupere va apărea numai când discul a completat datele transfer, și nu atunci când este cerut de program) Motivul pentru reproductibilitatea excepțiilor și nereproductibilitatea întreruperilor este că primele sunt apelate direct de program, iar cele din urmă indirect Pentru a înțelege cum funcționează întreruperile, luați în considerare un exemplu comun: un computer trebuie să imprime un șir de caractere pe terminalul său Programul colectează mai întâi toate caracterele destinate afișării pe ecran într-un buffer, inițiind Controlul fluxului Lizează variabila globală ptr, care ar trebui să indice începutul bufferului și face ca a doua variabilă globală să fie egală cu numărul de caractere de afișat Programul verifică apoi dacă terminalul este gata și, dacă este, tipărește primul caracter pe ecran (de exemplu, folosind registrele prezentate în Figura ) Prin pornirea procesului I/O, CPU este eliberat și poate rula un alt program sau poate face altceva După un timp, simbolul este afișat pe ecran După aceea, poate fi declanșată o întrerupere Pașii principali sunt enumerați mai jos (în formă simplificată) Acțiuni hardware: Controlerul dispozitivului încarcă linia de întrerupere pe magistrala de sistem Când CPU este gata să gestioneze o întrerupere, setează caracterul de confirmare a întreruperii pe magistrală Când controlerul dispozitivului detectează că semnalul de întrerupere a fost afirmat, plasează un mic întreg pe liniile de date pentru a se "introduce" (adică pentru a indica ce dispozitiv este sursa întreruperii) Acest număr se numește vector de întrerupere CPU citește vectorul de întrerupere din magistrală și îl stochează temporar CPU-ul împinge contorul de program și cuvântul de stare a programului în stivă CPU localizează noul contor de program folosind vectorul de întrerupere ca index într-un tabel din partea de jos a memoriei Dacă, de exemplu, dimensiunea contorului programului este de octeți, atunci vectorul de întrerupere n corespunde adresei /r Noul contor de program indică începutul rutinei de întrerupere pentru dispozitivul care este sursa întreruperii Adesea, cuvântul de stare a programului este încărcat sau modificat (de exemplu, pentru a bloca întreruperi ulterioare) Alte acțiuni sunt efectuate programatic: Managerul de întrerupere salvează toate registrele de care are nevoie pentru a putea fi restaurate ulterior Ele pot fi stocate pe stivă sau într-o masă de sistem Fiecare vector de întrerupere este partajat de toate dispozitivele de un anumit tip, deci nu se știe încă care terminal a cauzat întreruperea Numărul terminalului poate fi găsit citind valoarea unui registru După aceea, puteți citi orice alte informații despre întrerupere, cum ar fi codurile de stare Autorul nu are dreptate: aici vorbim de numărul de întrerupere Fiecare tip de întrerupere are propriul său număr Termenul "vector de întrerupere" este folosit atunci când adresa operatorului de întrerupere este găsită prin numărul de întrerupere, iar această adresă este reprezentată nu de o singură valoare, ci de mai multe, adică mai mult de un registru trebuie inițializat Cu alte cuvinte, adresa este reprezentată nu ca o valoare scalară, ci ca una multidimensională, vectorială - Notă științific ed Capitolul Stratul de arhitectură al setului de instrucțiuni Dacă apare o eroare I/O, aceasta trebuie tratată în acest moment I Se actualizează variabilele globale ptr și count Primul este incrementat cu pentru a indica următorul octet, iar al doilea este decrementat cu pentru a indica faptul că a mai rămas cu octet mai puțin de ieșit Dacă numărul este încă mai mare decât , atunci nu toate caracterele au fost încă afișate Caracterul indicat în prezent de ptr este copiat în registrul tampon de ieșire Dacă este necesar, se emite un cod special care spune dispozitivului sau controlerului de întrerupere că întreruperea a fost procesată Toate registrele salvate sunt restaurate Comanda de ieșire întrerupere este executată, readucerea CPU la starea în care se afla înainte de întrerupere După aceea, computerul continuă să funcționeze din locul în care a fost suspendat Există un concept important de transparență asociat întreruperilor Când apare o întrerupere, pot fi efectuate diverse acțiuni și pot fi lansate tot felul de programe, dar când totul este terminat, computerul ar trebui să revină exact la aceeași stare în care era înainte de întrerupere Un handler de întrerupere care are această proprietate se numește transparent Dacă computerul are un singur dispozitiv I/O, atunci întreruperile funcționează exact așa cum tocmai am descris Cu toate acestea, un computer mare poate conține multe dispozitive I/O, cu mai multe dispozitive care rulează în același timp, posibil pentru utilizatori diferiți Există o oarecare șansă ca, în timp ce gestionarea întreruperilor rulează, un alt dispozitiv I/O va încerca, de asemenea, să declanșeze propria întrerupere Există două abordări aici Primul este ca toți manipulatorii de întreruperi să prevină mai întâi (chiar înainte de salvarea registrelor) întreruperile ulterioare - în acest caz, întreruperile vor avea loc strict pe rând Cu toate acestea, acest lucru poate duce la probleme cu dispozitivele care nu pot fi inactive pentru o perioadă lungă de timp De exemplu, o legătură care acceptă o rată de transmisie de de biți pe secundă primește simboluri la fiecare de microsecunde Dacă primul caracter este neprocesat când sosește al doilea, datele se vor pierde Dacă computerul are dispozitive I/O similare, atunci cel mai bine este să atribuiți o anumită prioritate fiecărui dispozitiv, mare - pentru dispozitivele mai critice, scăzută - pentru dispozitivele mai puțin critice CPU trebuie să aibă și priorități, care sunt determinate de unul dintre câmpurile cuvântului de stare a programului Dacă un dispozitiv cu prioritate n provoacă o întrerupere, operatorul de întrerupere trebuie să ruleze și cu prioritate n Dacă manipulatorul de întreruperi se execută la prioritatea n, orice încercare de a gestiona o întrerupere de la un alt dispozitiv cu o prioritate mai mică va fi ignorată până când gestionarea întreruperilor se va termina și CPU începe să execute programul cu prioritate inferioară În același timp, întreruperile de la dispozitivele cu o prioritate mai mare trebuie procesate fără întârziere Deoarece rutinele de întrerupere în sine pot fi întrerupte, singura modalitate posibilă de a controla cu precizie situația este să vă asigurați că toate Controlul fluxului întreruperile erau transparente Luați în considerare un exemplu simplu cu mai multe întreruperi Lăsați computerul să aibă trei dispozitive de intrare-ieșire: o imprimantă, un disc și o linie RS cu prioritățile , și, respectiv, Inițial (t = , unde t este timpul) programul utilizatorului rulează La t = , imprimanta declanșează în mod neașteptat o întrerupere Rutina de întrerupere a serviciului (ISR) de la imprimantă este pornită, așa cum se arată în fig Întreruperea discului, prioritate , în așteptare Terminați linia RS ISR, primiți întrerupere de disc Întreruperea RSR , prioritate Prioritatea întreruperea imprimantei Închiderea unui disc ISR Oprirea unei imprimante ISR Aproximativ i - L Program! ISR! utilizator! imprimanta! ISR disc ISR! Program ! utilizator !imprimantă Ora -►- linii ISR! RS ! | Utilizator! Utilizator Utilizator Imprimanta Imprimanta [Utilizator! Grămadă Orez Exemplu cu mai multe întreruperi Secvențierea La t = întreruperi sunt necesare de către linia RS Deoarece linia RS are o prioritate mai mare ( ) decât imprimanta ( ), această întrerupere este gestionată Starea mașinii în care rulează imprimanta ISR este stocată în stivă, iar gestionarea întreruperilor de linie RS începe să se execute Puțin mai târziu, la t = , discul își încheie munca și semnalează acest lucru cu o întrerupere Cu toate acestea, prioritatea sa ( ) este mai mică decât prioritatea gestionarului de întrerupere ( ) care rulează în prezent, astfel încât CPU nu confirmă primirea semnalului de întrerupere, iar discul este forțat să aștepte La t = , linia RS ISR se termină și mașina revine la starea în care se afla înainte de întreruperea liniei RS , adică la starea corespunzătoare funcționării ISR imprimantei cu prioritate De îndată ce CPU comută la prioritatea , mai mult înainte ca prima comandă să fie executată, discul cu prioritate se întrerupe și ISR-ul discului este pornit După ce se încheie, rutina de întrerupere a imprimantei continuă din nou În cele din urmă, la t = , toate rutinele de întrerupere se termină și execuția programului utilizatorului se reia de unde a rămas Capitolul Stratul de arhitectură al setului de instrucțiuni De la , toate procesoarele Intel au avut două niveluri (prioritate) de întreruperi: întreruperi mascate și nemascabile Întreruperile nemascabile sunt de obicei folosite doar pentru a raporta situații foarte grave, cum ar fi erorile de paritate a memoriei Toate dispozitivele I/O au o singură întrerupere masabilă Când un dispozitiv I/O solicită o întrerupere, CPU utilizează vectorul de întrerupere în timp ce indexează tabelul cu de intrări pentru a găsi adresa operatorului de întrerupere Intrările din tabel sunt descriptori de segment de octeți Tabelul poate începe oriunde în memorie Registrul global indică începutul său Cu un singur nivel de întrerupere, nu există nicio modalitate ca CPU să aibă un dispozitiv cu prioritate înaltă să întrerupă un handler de întrerupere cu prioritate medie în timp ce un dispozitiv cu prioritate scăzută interferează Procesoarele Intel folosesc de obicei un controler de întrerupere extern (de exemplu A) pentru a rezolva problema La prima întrerupere (de exemplu, cu prioritate i), procesorul este suspendat Dacă apare o altă întrerupere cu prioritate mai mare după aceea, controlerul de întrerupere va declanșa întreruperea a doua oară Dacă a doua întrerupere are o prioritate mai mică, ea nu este inițiată până la sfârșitul primei Pentru ca acest sistem să funcționeze, controlerul de întrerupere trebuie să știe într-un fel că rutina de întrerupere curentă sa încheiat Prin urmare, când procesarea întreruperii curente este complet încheiată, CPU trebuie să trimită o comandă specială controlerului de întrerupere turnul din hanoi Acum că am explorat nivelul arhitecturii setului de instrucțiuni al celor trei mașini, trebuie să rezumam totul Să aruncăm o privire mai atentă la același exemplu de rezolvare a problemei "Turnul din Hanoi") Lista arată versiunea Java a acestui program În următoarele subsecțiuni, vom oferi programe de asamblare Pentium și UltraSPARC III Cu toate acestea, pentru a evita problemele cu Java I/O, pentru mașinile Pentium și UltraSPARC III, vom traduce versiunea programului nu în Java, ci în C Singura diferență este înlocuirea instrucțiunii Java prințip cu o instrucțiune standard în limbaj C : printf("Mutați discul de la la W, , j) Sintaxa liniei din instrucțiunea printf nu este importantă (linia este tipărită literal, cu excepția caracterelor #d, ceea ce înseamnă că următorul întreg va fi reprezentat în notație zecimală) Singurul lucru important aici este că procedura este apelată cu trei parametri: un șir de format și două numere întregi Am folosit limbajul C pentru Pentium și UltraSPARC III deoarece biblioteca Java I/O nu este disponibilă pentru aceste mașini, dar biblioteca C I/O este Diferența este minimă - doar o singură linie de ieșire pe ecran turnul din hanoi Rezolvarea problemei Turnului din Hanoi în asamblatorul Pentium Lista arată un posibil program C pentru un computer Pentium după traducere Registrul EUR este folosit ca indicator de cadru Primele două cuvinte sunt necesare pentru asamblare, astfel încât primul parametru n (sau N, deoarece caracterele sunt insensibile la majuscule și minuscule în macro-asamblatorul) este în celula EBP + , urmat de parametrii i și j în celulele EBP + și EUR + , respectiv Variabila locală k este în EUR + Листинг Решение задачи "Ханойская башня" для Pentium MODEL PLAT PUBLIC turnuri EXTERN printf:NEAR COD turnuri: PUSH EBP MOV EBP, ESP CMP[EBP+ ], □NE LI MOV ЕАХ, [EBP+ ] PUSH EAX MOV ЕАХ, [EBP+ ] PUSH EAX PUSH OFFSET FLAT:format CALL -prlntf ADD ESP, JMP Gata LI: MOV EAX, SUB EAX, [EBP+ ] SUB EAX, [EBP+ ] MOV [EBP+ ], EAX PUSH EAX MOV EAX, [EBP+ ] PUSH EAX MOV EAX, [EBP+ ] DEC EAX PUSH EAX CALL turnuri ADAUGĂ ESP, MOV EAX, [EBP+ ] PUSH EAX MOV EAX, [EBP+ ] PUSH EAX IMPINGAȚI CALL turnuri ADAUGĂ ESP, MOV EAX, [EBP+ ] PUSH EAX MOV EAX, [EBP+ ] PUSH EAX MOV EAX, [EBP+ ] DEC EAX PUSH EAX CALL turnuri ADAUGĂ ESP, компилируется для Pentium экспорт 'turnuri' импорт printf salvați EBP (indicator de cadru) setat nou indicatorul de cadru peste ESP f(n==l) sari daca n nu este egal cu printfi, j); salvând parametrii i, j și format, șirul este împins în stivă în ordine inversă (cerința limbajului C) OFFSET FLAT este adresa de format a apelului la procedura printf eliminarea parametrilor din stivă începe calculul k= -ij ЕАХ= -i ЕАХ= -І-з k=EAX turnuri de începere a procedurii (nl, i, k) ЕАХ=i împinge eu EAX=n EAX=nl împinge n- turnuri de apel de procedură (nl, i, -ij) pe stivă elimină parametrii din stiva începutul procedurii turnuri ( , i, j) împinge j ЕАХ=i împinge eu împinge pe stiva de apeluri towersd i, j) eliminați parametrii din stivă începutul procedurii turnuri (nl, -ij, i) împinge i EAX=k împinge k EAX = n ЕАХ=n- împinge pe stiva n- turnuri de apel de procedură (nl, -ij, i) ajustarea pointerului stivei Capitolul Stratul de arhitectură al setului de instrucțiuni Gata: LEAVE RET ; pregătirea pentru ieșire; reveni la programul de apelare DATE format DB "Mutați unitatea de la Sd la Sd\n" ; șir de format Sfârşit Procedura începe prin crearea unui nou cadru la sfârșitul celui vechi Pentru a face acest lucru, valoarea registrului ESP este copiată în indicatorul de cadru EBP Atunci n este comparat cu , iar dacă n > , săriți la declarația else Apoi, codul împinge trei valori pe stivă: adresa șirului de format, i și j, apoi se autoinvocă Parametrii sunt împinși pe stivă în ordine inversă, deoarece aceasta este o cerință a limbajului C Trebuie să plasați un pointer către șirul de format în partea de sus a stivei Procedura printf are un număr variabil de parametri, iar dacă parametrii sunt împinși pe stivă în ordine directă, procedura nu va ști unde se află șirul de format pe stivă După apelarea procedurii, este adăugat la registrul ESP pentru a elimina parametrii din stivă Ele nu sunt de fapt eliminate din memorie, dar schimbarea registrului ESP le face inaccesibile prin operațiuni normale de stivă Execuția părții el se începe la eticheta L Aici, expresia - - j este mai întâi evaluată, iar valoarea rezultată este stocată în variabila k Stocarea valorii în variabila k elimină necesitatea evaluării acestei expresii a doua oară Procedura se autoapelează apoi de trei ori, de fiecare dată cu parametri noi După fiecare apel, stiva este eliberată Procedurile recursive derutează uneori oamenii Dar, de fapt, nu sunt deloc dificile Parametrii sunt pur și simplu împinși pe stivă, după care procedura se autoapelează Rezolvarea problemei "Turnul din Hanoi" în asamblatorul UltraSPARC III Acum luați în considerare același program de asamblare UltraSPARC III (Listing ) Deoarece programul UltraSPARC III este complet ilizibil chiar și după multă practică, am decis să definim câteva caractere pentru a clarifica lucrurile Pentru ca un astfel de program să funcționeze, trebuie să fie rulat printr-un program numit cpp (preprocesorul C) înainte de asamblare Folosim litere mici aici deoarece asamblerul UltraSPARC III o cere (acest lucru în cazul în care cititorii doresc să tastați acest program și să-l ruleze) Lista Rezolvarea problemei Turnului din Hanoi pentru UltraSPARC III #define N SiO /* #define I Sil /* #define J SI /* #define K SIO /* #define ParamO SoO /* #define Paraml Sol /* #define Param So /* #define Scratch Sil /* N este parametrul de intrare */ I este parametrul de intrare */ J este parametrul de intrare */ K este variabila locală */ ParamO este parametrul de ieșire */ Paraml este parametrul de ieșire */ Param este parametrul de ieșire */ comentariile cpp sunt scrise ca în C*/ turnul din hanoi rgos turnuri globale turnuri: economisiți £sp,- , £sp cmp N, ! dacă(n== ) bne Altceva! dacă (n != ) mergi la Else sethi W(format), ParamO ! printf("Mutați discul c %d în I\n", sau ParamO, Ho(format) ! i, j) , ParamO ! ParamO - format adresa șirului mov I, Paraml ! Paraml = i cai printf ! apelați printf ÎNAINTE de a seta parametrul (j) mov J, Param ! operațiune goală pentru a seta parametrul b Gata! completare acum! introduce o operație goală Altfel: mov , K ! începe calculul k = - -J subK,J,K! k= -j sub K,I,K! k= - -j adăugați N, - , Scratch ! turnuri de pornire a procedurii (nl, i, k) mov Scratch, ParamO! Zgârietură = n- mov I, Paraml ! parametrul = i cai turnuri! turnuri de apel ÎNAINTE de a seta parametrul (k) mov K, Param ! operațiune goală după apel i proceduri pentru setarea parametrului mov , Paramo ! începe procedura towersd, i, j) mov I, Paraml ! parametrul = cai turnuri! turnuri de apel ÎNAINTE de a seta parametrul (J) mov J, Param ! parametrul = j mov Scratch, ParamO! turnuri de pornire a procedurii (n- , k, J) mov K, Paraml ! parametrul = k cai turnuri! turnuri de apel ÎNAINTE de a seta parametrul (J) mov J, Param ! parametrul = j Gata: ret! ieșire din procedură restabili! introduceți comanda goală după ret eu pentru a restabili Windows format: asciz "Mutați discul c £d în M\n" Din punct de vedere algoritmic, versiunea UltraSPARC III este identică cu versiunea Pentium În ambele cazuri, n este verificat mai întâi, iar dacă n > , trece la alt Principalele dificultăți ale versiunii UltraSPARC III sunt legate de unele proprietăți ale arhitecturii instrucțiunilor Codul UltraSPARC III trebuie să treacă mai întâi adresa șirului de format către printf, dar aparatul nu poate muta pur și simplu adresa în registrul care conține parametrul de ieșire, deoarece nu puteți introduce o constantă de de biți în registru într-o singură comandă Acest lucru necesită două comenzi: sethi și og Nu este nevoie să ajustați stiva după apel, deoarece fereastra de înregistrare este ajustată de comanda de restaurare la sfârșitul procedurii Capacitatea de a pune parametrii de ieșire în registre, mai degrabă decât de a accesa memorie, oferă câștiguri semnificative de performanță Acum luați în considerare comanda pore care urmează Terminat Aceasta este o operație goală care va fi întotdeauna executată chiar dacă urmează o comandă setată Capitolul Stratul de arhitectură al setului de instrucțiuni tranziție atrăgătoare Dificultatea constă în faptul că procesorul UltraSPARC III este foarte pipeline, iar în momentul în care o instrucțiune de ramificare este detectată de hardware, următoarea instrucțiune este aproape terminată de procesare Bun venit în lumea minunată a programării RISC! Această caracteristică se extinde și la apelurile de procedură Luați în considerare primul apel la procedura turnurilor în partea el se Procedura plasează n - în %o și i în %oi, dar face un apel către turnuri înainte de a plasa ultimul parametru în locul potrivit Pe un computer Pentium , treci mai întâi parametrii și apoi apelezi procedura Și aici treceți mai întâi o parte din parametri, apoi apelați procedura și abia după aceea treceți ultimul parametru Până când mașina realizează că are de-a face cu instrucțiunea cal , următoarea instrucțiune trebuie să fie executată (din cauza conductei) De ce să nu folosiți o operație goală în acest caz pentru a trece ultimul parametru? Chiar dacă acest parametru este cerut de prima comandă a procedurii apelate, el va fi deja în vigoare În cele din urmă, luați în considerare o parte a comenzii Done Aici, după comanda ret, se introduce și o operație goală Această operație nulă este utilizată pentru comanda de restaurare, care crește CWP cu pentru a restabili fereastra de registru la starea anterioară Arhitectura IA- si procesor Itanium Inevitabil, și foarte curând, va veni momentul în care va fi imposibil să se creeze ceva mai avansat decât modelele existente bazate pe arhitectura de instrucțiuni IA- și pe linia de procesoare Pentium Până acum, noile modele sunt îmbunătățite doar datorită noilor tehnologii de producție care vă permit să reduceți dimensiunea tranzistoarelor, ceea ce înseamnă creșterea frecvenței de ceas În același timp, devine din ce în ce mai dificilă creșterea vitezei de lucru, iar motivul pentru aceasta este limitările inerente arhitecturii de comandă IA- Singura soluție eficientă la problemă este trecerea de la IA- la o nouă arhitectură de instrucțiuni atunci când se dezvoltă noi procesoare Acestea sunt planurile pe care Intel le construiește Mai mult, ar trebui să lanseze două noi linii Prima dintre acestea, numită EMT- , este o versiune extinsă a Pentium cu registre de de biți și un spațiu de adrese de de biți Această arhitectură rezolvă problema spațiului de adrese, dar dificultățile de implementare a Pentium rămân Poate fi numită o versiune extinsă a arhitecturii Pentium O altă arhitectură dezvoltată în comun de Intel și Hewlett Packard se numește IA- Aceasta este deja o mașină cu drepturi depline pe de biți Mai mult decât atât, este izbitor de diferit în multe privințe de Pentium Inițial, IA- ar trebui să fie adus pe piața sistemelor de server profesionale, dar este foarte posibil ca ulterior această arhitectură să câștige un punct de sprijin în computerul desktop segment În orice caz, arhitectura IA- , implementată pentru prima dată în linia de procesoare Itanium, este atât de diferită de tot ceea ce am considerat înainte, încât este pur și simplu necesar să ne familiarizăm cu ea Arhitectura IA- si procesor Itanium mai aproape Deci, restul secțiunii este dedicată arhitecturii IA- ca atare și implementării acesteia în procesoarele din seria Itanium Problema Pentium Înainte de a trece la o discuție detaliată despre arhitectura IA- și procesorul Itanium , este util să înțelegem ce este de fapt în neregulă cu procesorul Pentium și ce probleme intenționează Intel să rezolve prin dezvoltarea unei noi arhitecturi Problema principală este că IA- este o arhitectură veche de instrucțiuni cu proprietăți complet nepotrivite pentru tehnologia modernă Aceasta este o arhitectură CISC tipică cu lungimi diferite de instrucțiuni și un număr mare de formate diferite care sunt dificil de decodat rapid și din mers Tehnologia actuală funcționează cel mai bine cu arhitecturile RISC, în care instrucțiunile au dimensiuni uniforme și codul operațional are lungime fixă, astfel încât este ușor de decodat Deși instrucțiunile de arhitectură IA- pot fi împărțite în micro-operații, cum ar fi instrucțiunile RISC în timpul execuției programului, acest lucru necesită hardware suplimentar (spațiu pe cip) și necesită timp și este dificil de dezvoltat Acesta este primul dezavantaj IA- este o arhitectură de comandă cu două adrese Arhitecturile de instrucțiuni de încărcare/stocare sunt populare în prezent, în care accesările la memorie sunt efectuate doar pentru a plasa operanzi în registre, iar toate calculele sunt efectuate folosind instrucțiuni de registru cu trei adrese Deoarece viteza procesorului crește mult mai repede decât memoria, situația cu ІА- se înrăutățește în timp Acesta este al doilea dezavantaj Arhitectura IA- conține un set mic și neregulat de registre Datorită numărului mic de registre de uz general (patru sau șase, în funcție de locul în care sunt alocate registrele ESI și EDI), rezultatele intermediare trebuie scrise în mod constant în memorie, ceea ce duce la accesări suplimentare la memorie, chiar și atunci când nu sunt în mod logic Necesar Acesta este al treilea dezavantaj Din cauza numărului insuficient de registre, există multe situații de dependență, în special dependențe WAR, deoarece rezultatele intermediare trebuie plasate undeva și nu există registre suplimentare Din cauza lipsei registrelor, se impune constant înlocuirea acestora (adică folosirea registrelor ascunse) Pentru a evita pierderile prea frecvente ale memoriei cache, comenzile trebuie executate în afara ordinului Cu toate acestea, semantica arhitecturii IA- definește întreruperi precise, astfel încât instrucțiunile executate în afara ordinii trebuie să scrie rezultatele în registrele de ieșire în ordine strictă Toate acestea sunt foarte greu de implementat în hardware Acesta este al patrulea dezavantaj Pentru ca viteza de funcționare să fie mare, sistemul trebuie să fie în mare parte canalizat Cu toate acestea, aceasta înseamnă că este nevoie de multe cicluri pentru a executa orice instrucțiune Prin urmare, predicția precisă a ramurilor devine esențială, deoarece numai instrucțiunile necesare trebuie să intre în conductă Cu toate acestea, chiar dacă procentul de predicții incorecte este scăzut, performanța este redusă semnificativ Acesta este al cincilea dezavantaj Capitolul Stratul de arhitectură al setului de instrucțiuni Pentru a evita problemele de predicție greșită a ramurilor, procesorul trebuie să execute instrucțiunile speculative, cu toate consecințele care decurg Acesta este al șaselea dezavantaj Nu vom enumera mai departe deficiențele, deoarece este deja clar că în spatele lor există o problemă reală Ceea ce nu am menționat încă este că adresele IA- pe de biți limitează dimensiunea programelor individuale la GB, ceea ce este o problemă serioasă pentru serverele de înaltă performanță Să presupunem că această problemă este rezolvată în arhitectura EMT- , dar deficiențele rămase rămân Situația cu IA- poate fi comparată cu starea de lucruri din mecanica cerească chiar înainte de apariția lui Copernic La acea vreme, astronomia era dominată de teoria geocentrică, conform căreia Pământul este centrul universului și este staționar, iar planetele se mișcă în jurul lui Cu toate acestea, noi observații au arătat din ce în ce mai multe inconsecvențe ale acestei teorii cu realitatea, ceea ce a dus în cele din urmă la eșecul complet al acesteia Intel se afla aproape in aceeasi pozitie O mulțime de tranzistoare din procesorul Pentium sunt dedicate exclusiv conversiei instrucțiunilor CISC în instrucțiuni RISC, rezolvării conflictelor, predicției de ramificație, corectării previziunilor greșite și rezolvării multor alte probleme de acest fel și doar o mică parte rămâne pentru munca efectivă care utilizatorul chiar are nevoie de aceste tranzistoare Prin urmare, Intel a ajuns la următoarea concluzie: trebuie să aruncați IA- la coșul de gunoi și să o luați de la capăt (IA- ) Arhitectura EMT- este destinată doar să câștige ceva timp, lăsând problema nerezolvată Model IA- - calcule cu paralelism explicit de instrucțiuni Principiul de bază al organizării arhitecturii IA- este de a muta încărcarea de la timpul de execuție la timpul de compilare Procesorul Pentium reordonează instrucțiunile, înlocuiește registre, alocă blocuri funcționale și îndeplinește multe alte funcții în timpul execuției, ceea ce duce la utilizarea maximă a tuturor resurselor hardware În modelul IA- , aceste sarcini sunt rezolvate în avans de către compilator Ca rezultat, generează un program care poate fi executat fără manipulare nejustificată a hardware-ului De exemplu, în Pentium , compilatorul primește informații că există doar registre în mașină, deși sunt de fapt dintre ele, ca urmare, în timpul execuției programului, trebuie să ieși cumva pentru a evita interdependențele Conform arhitecturii IA- , compilatorul primește informații fiabile despre numărul de registre din mașină și apoi generează un program în care nu există conflicte între registre În plus, compilatorul monitorizează încărcarea blocurilor funcționale și nu rulează instrucțiuni care ar trebui să se refere la blocuri funcționale ocupate Modelul în care paralelismul hardware este vizibil pentru compilator se numește EPIC (Explicitly Parallel Instruction Computing) Arhitectura IA- si procesor Itanium comenzi) Într-o anumită măsură, modelul EPIC poate fi considerat o evoluție a tehnologiei RISC Unele caracteristici ale IA- cresc semnificativ productivitatea Printre acestea se numără reducerea numărului de accesări la memorie, programarea instrucțiunilor, reducerea numărului de salturi condiționate și operațiuni speculative Vom discuta despre toate aceste caracteristici atât din punct de vedere teoretic, cât și în contextul implementării lor în Itanium Reducerea numărului de accesări la memorie Modelul de memorie Itanium este destul de simplu În total, sunt furnizați de octeți de memorie liniară Comenzile disponibile vă permit să accesați blocuri de memorie de , , , , și octeți (aceasta din urmă valoare a fost introdusă pentru compatibilitatea cu numerele în virgulă mobilă de de biți ale standardului IEEE ) Nu există o nevoie categorică de a alinia accesele la memorie de-a lungul granițelor naturale, dar performanța este mai scăzută fără aliniere Memoria poate fi fie big endian, fie little endian; un format sau altul este setat de un bit special într-un registru încărcat de sistemul de operare Accesul la memorie în computerele moderne este considerat un blocaj Acest lucru se datorează faptului că procesoarele funcționează mult mai rapid decât modulele de memorie Numărul de accesări la memorie poate fi redus prin plasarea unui cache mare de prim nivel pe cipul procesorului și a unui cache și mai mare de nivel al doilea în imediata apropiere a cipului Două module de memorie cache sunt echipate cu toate procesoarele moderne În același timp, există și alte metode pentru a reduce cantitatea de interacțiune cu memorie, iar unele dintre ele sunt implementate în IA- Cea mai bună modalitate de a accelera accesul la memorie este să efectuați această operație în fundal Procesorul Itanium are de registre de uz general pe de biți Primele dintre ele sunt statice, iar restul de sunt grupate într-o stivă de registre, care amintește de o fereastră de registre UltraSPARC III Spre deosebire de UltraSPARC, numărul de registre disponibile pentru un program variază de la o procedură la alta Ca rezultat, fiecare procedură are acces la de registre statice și un număr (variabil) de registre alocate dinamic Când procedura este apelată, indicatorul stivei de registre este deplasat astfel încât parametrii de intrare să fie vizibili în registre, dar registrele în sine nu sunt distribuite între variabilele locale Procedura în sine determină numărul de registre de care are nevoie și mută indicatorul stivei în consecință Nu este nevoie să salvați conținutul acestor registre la intrare și să le restaurați la ieșire, deși dacă o procedură trebuie să modifice un registru static, trebuie mai întâi să-și salveze în mod explicit valoarea anterioară și apoi să o restabilească Deoarece numărul de registre este exprimat printr-o variabilă disponibilă și este determinat de cerințele fiecărei proceduri particulare, utilizarea ineficientă a registrelor este eliminată In afara de asta, Capitolul Stratul de arhitectură al setului de instrucțiuni profunzimea maximă a apelurilor de procedură este crescută, la care nu este necesar ca registrele să fie "transformate" în memorie Itanium are de registre în virgulă mobilă organizate conform standardului IEEE și nestivuite Un număr mare de registre de acest tip vă permite să stocați rezultatele intermediare ale multor operații cu virgulă mobilă în registre fără a le muta în memorie În plus, Itanium oferă de registre de predicate de bit, registre de ramuri și de registre de aplicații specializate care sunt utilizate pentru o varietate de scopuri, cum ar fi schimbul de parametri între programele de aplicație și sistemul de operare Schema generală a registrelor Itanium este prezentată în fig registre generale de registre în virgulă mobilă de registre de predicate de bit de registre utilizate ca stivă de registre de registre statice registre aplicate registre de filiale Orez Itanium registre Planificarea echipei Unul dintre cele mai grave dezavantaje ale Pentium este dificultatea de a programa instrucțiunile pentru procesare în diferite blocuri funcționale fără interdependențe Pentru a rezolva această problemă în timpul execuției, sunt implicate mecanisme foarte complexe, al căror suport hardware necesită mult spațiu pe cip În arhitectura IA- și implementarea acesteia - Itanium - aceste probleme sunt rezolvate prin transmiterea funcțiilor corespunzătoare la compilator Fiecare program constă acum dintr-o secvență de grupuri de instrucțiuni Comenzile din cadrul aceluiași grup nu intră în conflict între ele, nu consumă mai multe resurse și nu accesează mai multe blocuri funcționale decât cele oferite de sistem, nu formează interdependențe RAW și WAW (interdependențele WAR sunt permise într-o măsură limitată) Avem impresia că grupurile succesive de instrucțiuni sunt executate strict în ordine, deși, de fapt, dacă este sigur, procesorul poate rula o parte din instrucțiunile grupului următor înainte ca cel precedent să fie finalizat Astfel, procesorul poate programa execuția instrucțiunilor în cadrul fiecărui grup individual în orice ordine, dacă este posibil - în paralel Arhitectura IA- si procesor Itanium modul nominal În acest caz, probabilitatea de conflicte între echipe este zero Dacă un grup de comenzi încalcă regulile de mai sus, comportamentul programului devine nedefinit Într-o astfel de situație, responsabilitatea de a se asigura că codul de asamblare obținut din programul sursă respectă toate cerințele revine compilatorului Pentru a compila rapid în timpul depanării programului, compilatorul poate pune fiecare comandă într-un grup separat; acest lucru este simplu de făcut, dar performanța este redusă ca urmare a acestei operațiuni, iar timpul de optimizare a codului de ieșire este semnificativ crescut Comenzile sunt combinate în pachete de de biți, ca cel prezentat în partea de sus a Fig Fiecare pachet conține trei instrucțiuni pe de biți și un model de biți Numărul de fascicule dintr-un grup de comenzi nu este întotdeauna exprimat ca un întreg - în unele cazuri, grupurile încep și se termină în mijlocul fasciculelor biți biți Grup de operații registrul de predicate Orez Fasciculul din arhitectura IA- este format din trei comenzi Există peste de formate de comandă Pe fig arată cel mai comun format În acest caz, este folosit pentru a efectua operația ADD cu ALU, care plasează suma a două registre în al treilea Câmpul grup de operații definește clasa generală a instrucțiunii (de exemplu, operația ALU cu numere întregi) Câmpul tip tranzacție indică tranzacția specifică (de exemplu, ADD sau SUB) Urmează trei câmpuri de înregistrare Ultimul câmp al acestui format, câmpul registrului de predicate, va fi discutat puțin mai târziu Șablonul de pachet indică ce blocuri funcționale sunt necesare pentru a-l procesa și, de asemenea, determină poziția limitei grupului de instrucțiuni (dacă există) Principalele blocuri funcționale sunt instrucțiuni ALU întregi și non-întregi, accesări la memorie, operații cu virgulă mobilă, ramificare etc Evident, cu blocuri și instrucțiuni, sunt necesare combinații de bază pentru ortogonalitatea completă, plus x combinații suplimentare pentru a determina grupați marcatorii după comenzile , și Deoarece sunt disponibili doar biți, sunt permise doar câteva dintre varietatea de combinații Pe de altă parte, dacă trei instrucțiuni în virgulă mobilă ar putea fi incluse în pachet simultan, procesorul pur și simplu nu ar putea Capitolul Stratul de arhitectură al setului de instrucțiuni rulați-le în același timp Astfel, combinațiile efectiv fezabile sunt considerate valide Reducerea numărului de salturi condiționate - predicție O altă caracteristică a arhitecturii IA- este un nou mod de a gestiona salturile condiționate Dacă ar fi posibil să scăpăm de majoritatea, procesorul ar fi mult mai simplu și ar rula mult mai rapid La prima vedere, ar putea părea imposibil să eliminați salturile condiționate, deoarece programele sunt întotdeauna pline de instrucțiuni if Cu toate acestea, arhitectura IA- folosește o tehnologie specială numită predicție, care poate reduce foarte mult numărul lor [ , ] Să descriem pe scurt această tehnologie În mașinile de astăzi, toate instrucțiunile sunt necondiționate în sensul că atunci când CPU întâlnește o instrucțiune, pur și simplu o execută Aici întrebarea nu este niciodată rezolvată: "A performa sau a nu face?" Dimpotrivă, într-o arhitectură de predicat, comenzile conțin condiții care vă spun când să executați comanda și când nu Această tranziție de la comenzile necondiționate la comenzile predicate este cea care ne permite să scăpăm de multe salturi condiționate În loc să alegeți una sau alta secvență de comenzi necondiționate, toate comenzile sunt îmbinate într-o singură secvență de comenzi predicate, în care diferite comenzi au predicate diferite Pentru a înțelege cum funcționează predicția, luați în considerare un exemplu simplu (listele - ) care arată execuția condiționată a comenzilor (execuția condiționată este precursorul predicației) În Lista , vedem o declarație if În Listarea , după ce a fost tradus, au existat trei comenzi: comparați, săriți și mutați În Listarea , am scăpat de saltul condiționat folosind noua instrucțiune CMOVZ, care este o instrucțiune de mutare condiționată Această instrucțiune verifică dacă al treilea registru R este egal cu zero Dacă da, atunci comanda copiază R în R Dacă nu, comanda nu face nimic Lista - - Declarația if dacă (Rl== ) R = R ; Lista - - Cod de asamblare pentru Lista CMP R BNE L MOV-R , R L : Lista - - Comandă condiționată CMOVZ R R R Dacă avem o instrucțiune care poate copia date atunci când orice registru este zero, atunci putem avea și o instrucțiune care copiază datele dacă orice registru nu este zero Să fie aceasta comanda CMOVN Cu ambele comenzi la locul lor, suntem deja pe drumul spre execuția completă condiționată Imaginați-vă o instrucțiune іf cu mai mulți operatori de atribuire în partea apoi și mai mulți operatori de atribuire în partea el se Toate acestea frag Arhitectura IA- si procesor Itanium Elementul programului poate fi tradus în cod care va seta un registru la dacă condiția nu este îndeplinită și la o altă valoare dacă condiția este îndeplinită Astfel, asignările din partea apoi pot fi compilate într-o secvență de instrucțiuni CMOVN, iar asignările din partea el se pot fi compilate într-o secvență de instrucțiuni CMOVZ Toate aceste instrucțiuni, inclusiv instrucțiunile setului de registre, CNOVN și CMOVZ, formează un singur bloc principal fără salturi condiționate Comenzile pot fi chiar reordonate în timpul compilării sau în timpul executării Singura cerință este ca condiția să fie cunoscută până în momentul în care instrucțiunile condiționate trebuie să fie plasate în registrele de ieșire (adică undeva la capătul conductei) Un exemplu simplu de fragment de program cu instrucțiuni then și else este prezentat în Listările - Lista - , Declarația if dacă(Rl == ) { R = R ; R = R : } else { R =R ; R =R ; Lista - - Cod de asamblare pentru Lista CMP R BNE L MOV-R R MOV R R BR L LI:MOV-R R MOV-R -R L : Lista - Execuție condiționată CMOVZ R R R CMOVZ R R R CMOVN R R R CMOVN R R R Am arătat doar instrucțiuni condiționale foarte simple (luate din arhitectura de instrucțiuni Pentium ), dar în arhitectura IA- toate instrucțiunile sunt predicate Aceasta înseamnă că execuția fiecărei comenzi poate fi condiționată Câmpul suplimentar pentru Registrul de predicați pe biți pe care l-am menționat vă permite să selectați unul dintre cele de registre de predicate pe biți Prin urmare, instrucțiunea if poate fi compilată într-un cod care setează unul dintre registrele de predicat la dacă condiția este adevărată și la dacă condiția este falsă Celălalt caz predicat este inversat simultan și automat Astfel, cu suportul predicației, instrucțiunile mașinii care sunt formate din instrucțiunile then și el se se contopesc într-un singur flux de instrucțiuni, iar instrucțiunile primei dintre ele au un câmp de registru de predicate de unul, în timp ce al doilea are un zero unu Listările - arată cum să folosiți predicția pentru a elimina tranzițiile Instrucțiunea CMPEQ compară două registre și setează registrul predicat P la dacă acestea sunt egale și la dacă nu sunt egale În plus, comanda inversează un alt registru, de exemplu, P După aceea piesele comandă Capitolul Stratul de arhitectură al setului de instrucțiuni dacă și atunci pot fi plasate unul după altul, iar fiecare dintre ele este asociat cu un anumit caz predicat (cazul este indicat în paranteze unghiulare) Orice cod poate fi plasat aici, atâta timp cât fiecare comandă este prezisă corect Lista - - Declarația if f(Rl == R ) R =R +R : Altfel R = R - R Lista - - Cod de asamblare pentru listare CMP R R BNE L MOV-R R ADAUGĂ R R BR L LI: MOV-R R SUB-R -R L : Lista - - Execuția predicatelor CMPEQ R R P ADAUGĂ R ,R ,R SUB R R R În arhitectura IA- , această idee este adusă la concluzia sa logică - aici comenzile de comparație, comenzile aritmetice și unele alte comenzi sunt asociate cu registrele de predicate Instrucțiunile predicate pot fi plasate secvenţial în conductă, fără probleme sau timpi de nefuncţionare Prin urmare, sunt foarte utile În arhitectura IA- , predicția are loc după cum urmează Fiecare instrucțiune este de fapt executată, iar la sfârșitul conductei, când este deja necesară stocarea rezultatului în registrul de ieșire, se verifică dacă predicția este adevărată Dacă da, rezultatele sunt pur și simplu scrise în registrul de ieșire Dacă predicția este falsă, atunci registrul de ieșire nu este scris Puteți citi mai multe despre predicție în literatura suplimentară [ ] Încărcare speculativă O altă caracteristică a IA- care îmbunătățește performanța este suportul pentru încărcare speculativă Dacă instrucțiunea LOAD este speculativă și nu funcționează, atunci în loc să arunce o excepție, pur și simplu se oprește din execuție și raportează că registrul în care trebuia să fie încărcat este invalid Acesta folosește același bit otravă pe care l-am menționat în capitolul Și o excepție va fi aruncată numai dacă apoi încercați să utilizați acest registru De obicei, la încărcarea speculativă, compilatorul plasează comenzi LOAD înaintea altor comenzi Deoarece aceste comenzi încep să se execute mai devreme decât ar trebui, ele se pot finaliza înainte ca rezultatele să fie necesare În locul în care trebuie să obțină valoarea unui anumit registru, compilatorul introduce comanda SNECK Dacă valoarea este deja acolo, comanda SNESK funcționează Rezumatul capitolului se topește în același mod ca NOP, iar execuția programului continuă imediat Dacă încă nu există nicio valoare în registru, următoarea instrucțiune este forțată să fie inactivă În concluzie, putem spune că în mașinile cu arhitectura IA- sunt implementate mai multe mecanisme de creștere a performanței În primul rând, este o mașină RISC modernă, canalizată, cu trei adrese, care acceptă un mecanism de încărcare/stocare În al doilea rând, compilatorul determină ce instrucțiuni pot fi executate în același timp și, fără conflict, grupează aceste instrucțiuni în pachete Astfel, procesorul poate programa pur și simplu procesarea fasciculelor fără să se gândească la vreo verificare În al treilea rând, predicția vă permite să combinați comenzile ambelor ramuri în operatorul f, eliminând în același timp atât ramura condiționată, cât și necesitatea de a prezice această ramură În cele din urmă, încărcarea speculativă permite apelarea operanzilor înainte de timp și, chiar dacă mai târziu se dovedește că acești operanzi nu sunt necesari, nu se va întâmpla nimic rău Informații suplimentare despre procesorul Itanium și microarhitectura acestuia pot fi găsite în literatura suplimentară [ , ] Rezumatul capitolului Pentru majoritatea oamenilor, nivelul arhitecturii setului de instrucțiuni este "limbajul mașinii" La acest nivel, aparatul are memorie de octeți sau de cuvinte de câteva zeci de megaocteți și conține instrucțiuni precum MOVE, ADD și BEQ În majoritatea computerelor moderne, memoria este organizată ca o secvență de octeți, cu sau octeți grupați în cuvinte De obicei, o mașină are între și de registre, fiecare conținând un cuvânt La unele mașini (de exemplu, în Pentium ) atunci când se accesează cuvinte de memorie, alinierea pe granițele naturale ale celulelor nu este necesară, în altele (de exemplu, în UltraSPARC III) aceasta este o condiție obligatorie Instrucțiunile au de obicei , sau operanzi, care sunt accesați folosind diverse moduri de adresare: imediat, direct, înregistrare, index etc Instrucțiunile pot de obicei muta date, efectua operații unare și binare (inclusiv aritmetice și logice), face salturi, apelează proceduri, execută bucle și, uneori, unele I/O Instrucțiunile tipice mută un cuvânt din memorie într-un registru sau invers, se adună, se scad, se înmulțesc sau se împart două registre sau un registru și un cuvânt din memorie sau se compară două valori în registre sau memorie Destul de des, numărul de instrucțiuni din computere depășește În procesoarele CISC, există și mai multe Pentru a transfera controlul la nivelul arhitecturii instrucțiunilor, sunt utilizate diverse primitive: sărituri, proceduri de apelare și coroutine, captarea excepțiilor și gestionarea întreruperilor Salturile sunt folosite pentru a opri o secvență de comenzi și a porni una nouă Procedurile vă permit să selectați un fragment al programului, care poate fi apoi apelat din diferite locuri din același program Coroutinele permit două fire de control să ruleze în paralel Captarea excepțiilor este utilizată pentru a semnala situații excepționale (de exemplu, o depășire) Mecanism de întrerupere Capitolul Stratul de arhitectură al setului de instrucțiuni vă permite să efectuați I/O în paralel cu calculele principale, în timp ce de îndată ce I/O este finalizată, CPU primește un semnal despre aceasta Problema Turnului din Hanoi poate fi rezolvată folosind recursiunea În cele din urmă, arhitectura IA- utilizează modelul de calcul EPIC, care simplifică implementarea paralelismului în programe Pentru a îmbunătăți performanța, această arhitectură asigură gruparea instrucțiunilor, predicția și încărcarea speculativă Arhitectura IA- poate fi un bun înlocuitor pentru Pentium , chiar dacă impune o sarcină grea compilatorului în ceea ce privește menținerea paralelismului Întrebări și sarcini Un cuvânt dintr-un sistem big endian i se atribuie valoarea numerică Să presupunem că acest cuvânt este transferat octet cu octet și stocat într-un sistem big endian, cu octetul sursă corespunzând octetului destinație și așa mai departe valoarea numerică a unui cuvânt într-un sistem big-endian? În Pentium , instrucțiunile pot conține orice număr de octeți, chiar și impari În UltraSPARC III, toate comenzile conțin un număr par de octeți Care este avantajul Pentium ? Dezvoltați un cod operațional extins care vă permite să codificați următoarele într-o instrucțiune pe de biți: + echipe cu două adrese de de biți și un număr de registru de biți; + de comenzi cu o adresă de biți și un număr de registru de biți; + de comenzi fără adrese și registre Lăsați mașina să accepte comenzi pe biți și adrese pe biți Unele comenzi conțin o adresă, altele două Dacă există n instrucțiuni cu două adrese, care este numărul maxim de instrucțiuni cu o singură adresă? Este posibil să se dezvolte un astfel de cod operațional extins care să permită codificarea următoarelor într-o instrucțiune de biți (dimensiunea registrului este de biți): + comenzi cu trei registre; + de comenzi cu un singur registru; + comenzi fără registre Să existe o mașină unicast cu un registru de adunare Iată semnificațiile unor cuvinte de memorie: + cuvântul conține numărul ; + cuvântul conține numărul ; Întrebări și sarcini + cuvântul conține numărul ; + cuvântul conține numărul ; Ce valori se vor încărca următoarele comenzi în registrul totalizatorului? ÎNCĂRCARE IMMEDIATĂ ÎNCĂRCARE DIRECT ÎNCĂRCARE INDIRECTA ÎNCĂRCARE IMMEDIATĂ ÎNCĂRCARE DIRECT ÎNCĂRCARE INDIRECTA Pentru fiecare dintre cele patru tipuri de mașini - fără adresă, uni-adresă, cu două adrese și cu trei adrese - scrieți un program pentru a evalua următoarea expresie: X \u d (A + B x C) / (D -ExF) Sunt disponibile următoarele comenzi: + fără adresă: PUSH M, POP M, ADD, SUB, MUL, DIV; + unicast: LOAD M, STORE M, ADD M, SUB M, MUL M, DIV M; + două adrese: MOV (X = Y), ADD (X = X + Y), SUB (X = X - Y), MUL (X = X x Y), DIV (X = X/Y); + trei adrese: MOV (X = Y), ADD (X = Y + Z), SUB (X = Y - Z), MUL (X = Y x Z), DIV (X = Y / Z) Aici M este o adresă de memorie de biți, iar X, Y și Z sunt fie adrese de biți, fie registre de biți Mașina neadresată folosește o stivă, mașina unicast folosește un registru de acumulator, iar celelalte două au registre și instrucțiuni care funcționează pe toate combinațiile de locații și registre de memorie Instrucțiunea SUB X,Y scade Y din X, iar instrucțiunea SUB X,Y,Z scade Z din Y și pune rezultatul în X Dacă lungimea codului operațional este de biți și dimensiunile instrucțiunii sunt multipli de biți, câți biți are nevoie fiecare mașină pentru calcule X? Veniți cu un mecanism de adresare care vă permite să definiți un set arbitrar de de adrese într-un câmp de biți, nu neapărat adiacent Care este dezavantajul programelor automodificatoare care nu a fost menționat în textul acestui capitol? Schimbați următoarele formule de la notația infixă la notația poloneză inversă: ) A + B + C + D + E; ) (L + B) x (C + D) + E; ) (ЛхВ) + (Схй) + £; ) (L - B) x (((C - D x E) / F) / G) x I I Care dintre următoarele perechi de formule în notație poloneză inversă sunt echivalente din punct de vedere matematic? ) L B + C + și L B C + +; ) AB-C-iABC ; ) LVxS+iLAN + x Capitolul Stratul de arhitectură al setului de instrucțiuni Convertiți următoarele formule din notație poloneză inversă în notație infixă: ) AB + C + D x; ) AB / C D / +; ) ABCDE + xx/ ) AB CDExF / + G - H / x+ Scrieți trei formule în notație poloneză inversă care nu pot fi convertite în notație infixă Convertiți următoarele formule logice infixe la notația poloneză inversă: ) (A ȘI B) SAU C; ) (A SAU B) ȘI (A SAU ; ) (A ȘI B) SAU (C ȘI D) Schimbați următoarea formulă infixă pentru a inversa notația poloneză și scrieți codul IJVM pentru a o executa: ( x + )-( / + ) Să existe o comandă de asamblare: MOV REG ADDR Aceasta este o comandă Pentium pentru a încărca un registru din memorie, dar pe un UltraSPARC III, pentru a încărca un registru din memorie, scrieți: LOAD ADDR REG De ce operanzii sunt scrisi în ordine diferită? Câte registre sunt în aparat, ale căror formate de comandă sunt prezentate în fig ? În formatele de comandă din fig bit face posibilă distingerea între opțiunile de format și Cu toate acestea, nu este furnizat niciun bit special pentru a defini opțiunea de format De unde știe hardware-ul că este necesară opțiunea ? În mod normal, un program localizează variabila X în intervalul de la A la B Dacă ar exista o instrucțiune cu trei adrese cu operanzi A, B și X, câți biți din codul de condiție ar fi setați de această instrucțiune? Pentium conține un bit de cod de condiție, a cărui stare depinde de transportul bitului după ce a fost efectuată o operație aritmetică De ce este nevoie de asta? Nu există nicio instrucțiune în UltraSPARC III care să încarce un număr de de biți într-un registru În schimb, se folosește de obicei o secvență de două comenzi: SETHI și ADD Există alte modalități de a încărca un număr de de biți într-un registru? Argument Unul dintre prietenii tăi îți bate la ușă la dimineața și anunță cu bucurie că a avut o idee grozavă - să creeze o echipă cu două coduri de funcționare Ce vei face în această situație: trimite-ți prietenul să obțină un brevet sau trimite-l (gândește-te mai departe)? Întrebări și sarcini Procesorul nu oferă instrucțiuni de offset mai mari de biți Înseamnă asta că adresarea memoriei în intervalul de peste nu este posibilă? Dacă este posibil, explicați cum se face Următoarele forme de verificare sunt foarte frecvente în programare: dacă (k== ) dacă (a>b) dacă (k semafor = semafor + (dacă un alt proces încearcă acum să reducă operația pe acest semafor, poate face acest lucru și își poate continua activitatea) Semafor = semafor + jos Procesul este suspendat până când un alt proces efectuează o operație ip pe acest semafor Semafor = semafor - După cum sa menționat deja, problema rasei poate fi rezolvată prin intermediul limbajului Java, dar acum discutăm despre sisteme de operare, prin urmare, trebuie să implementăm cumva mecanismul semaforului în Java, deoarece nu există o clasă standard pentru ele Cu toate acestea, putem face acest lucru presupunând că cele două metode, sus și jos, care fac apelurile de sistem în sus și respectiv în jos, au fost deja scrise și folosesc numere întregi obișnuite ca parametri Lista arată cum puteți rezolva condițiile de cursă folosind semafoare La clasa m se adaugă două semafore: un semafor disponibil, setat inițial la (aceasta este dimensiunea tamponului) și un semafor filat, setat inițial la Producătorul începe cu o instrucțiune P , iar consumatorul începe cu o declarație C Apelarea la semaforul fi lied suspendă imediat consumatorul Când producătorul găsește primul număr, apelează metoda down cu variabila disponibilă ca parametru, setând-o la În instrucțiunea P , producătorul apelează metoda cu parametrul fii led, setând fi lied la Această acțiune eliberează consumatorul, care acum poate finaliza apelarea metodei down După aceea, fi lied devine și ambele procese continuă Să ne întoarcem din nou la curse Fie la un moment dat ip = , și out = , producătorul execută operatorul P , iar consumatorul execută operatorul C Consumatorul finalizează acțiunea și trece la instrucțiunea C , care apelează metoda down pe semaforul fi liat, care era înainte de apel și după apel, ia valoarea Consumatorul introduce acest număr și trece la instrucțiunea C Chiar înainte ca consumatorul să fie pe cale să apeleze metoda down, producătorul generează următorul număr și execută rapid P , P și P În acest moment, fii led = Producătorul va apela metoda up pe acest semafor, iar metoda down va fi apelată de consumator Dacă consumatorul face primul apel, acesta va fi suspendat până când producătorul îl eliberează (prin apelarea metodei ip) Dacă producătorul face primul apel, atunci sema Capitolul Stratul sistemului de operare for va fi setat la și consumatorul nu va fi deloc întrerupt În ambele cazuri, semnalul de declanșare nu se va pierde De aceea am introdus semafoare în program Lista Funcționare în paralel folosind semafore clasa publica m { final public static int BUF SIZE = ; // tampon de la la final public static long MAX PRIME= L; // opriți aici public static int in = , out = ; // indicii către date public static long buffer[ ] = nou lung[BUF SIZE]; // numerele sunt stocate aici producator public static p; // numele fabricantului consumator public static c; // numele consumatorului public static int fi led = disponibil = ; // semafoare public static void main(String args[ ]) { // clasa principală p = nou producatorO; // creează un producător c = nou consumatorO; // creează consumator R startO; // începe producătorul Cu startO; // porniți consumatorul } // Aceasta este o funcție de aplicație pentru incrementarea ciclică a ip și în afara public static int next(int k) {if (k ) write(outfd, buffer count); } în timp ce (număr > ); /* Închide fișierele */ close(infd); close(outfd); Apelul de citire are trei parametri: un descriptor de fișier, un buffer și un număr de octeți Acest apel trebuie să citească numărul necesar de octeți din fișierul specificat în buffer Numărul de octeți citiți este plasat în variabila de numărare Valoarea numărului poate fi mai mică de octeți dacă fișierul este prea scurt Apelul de scriere copiază octeții citiți în fișierul de ieșire Bucla continuă până când fișierul de intrare a fost citit complet Apoi bucla se termină și ambele fișiere sunt închise Descriptorii de fișiere în UNIX sunt numere întregi mici (de obicei până la ) Descriptorii de fișiere , și corespund intrării standard, ieșirii standard și, respectiv, erorii standard De obicei, primul se referă la tastatură, iar al doilea și al treilea la afișaj, deși este util Capitolul Stratul sistemului de operare Dezvoltatorul poate redirecționa orice flux standard de intrare/ieșire către un fișier Multe programe UNIX preiau intrarea de la intrarea standard și scriu ieșirea la ieșirea standard Astfel de programe se numesc filtre Directorul rădăcină Fișiere de date Orez Un fragment din sistemul de directoare al sistemului de operare UNIX Exemple de sisteme de operare Strâns legat de sistemul de fișiere este sistemul de directoare Fiecare utilizator poate avea mai multe directoare, iar fiecare director poate conține fișiere și subdirectoare Un sistem UNIX este de obicei configurat cu un director principal, așa-numitul director rădăcină, care conține subdirectoare bin (pentru programele utilizate în mod obișnuit), dev (pentru fișiere speciale de dispozitiv I/O), ib (pentru biblioteci) și usr (pentru directoarele utilizatorilor, cum este prezentat în Fig ) În exemplul nostru, directorul usr conține subdirectoarele ast și jim Directorul ast include două fișiere (data și foo c) și un subdirector bin care conține fișiere (gamei, game , ) Pentru a denumi un fișier, trebuie să specificați calea acestuia din directorul rădăcină Calea conține o listă a tuturor directoarelor de la directorul rădăcină la fișier, barele oblice sunt folosite pentru a separa directoarele De exemplu, calea către fișierul game este /usr/ast/bin/game O cale care începe la directorul rădăcină se numește cale absolută În orice moment, fiecare program care rulează are un director curent Calea poate fi legată de directorul curent În acest caz, nu este plasată nicio bară oblică la începutul căii (pentru a o distinge de o cale absolută) O astfel de cale se numește cale relativă Dacă /usr/ast este directorul curent, atunci fișierul date poate fi accesat folosind calea bin/date Utilizatorul poate crea un link către fișierul altcuiva utilizând apelul de sistem link În exemplul nostru, căile /usr/ast/bin/date și /usr/jim/jotto conduc la același fișier Nu este permisă aplicarea de legături către directoare pentru a preveni ciclurile în sistemul de directoare Apelurile deschise și create pot folosi căi absolute sau relative Principalele apeluri pentru manipularea directoarelor UNIX sunt enumerate în Tabelul Apelarea mkdir creează un director nou, iar rmdir elimină un director gol existent Următoarele trei apeluri sunt folosite pentru a citi intrările din director Primul deschide directorul, al doilea citește elemente din acesta, al treilea închide directorul Apelarea chdir schimbă directorul curent Tabelul Apeluri de bază pentru lucrul cu directoare pe un sistem UNIX Apel de sistem Descriere mkdir(nume, mod) Creați un director nou rmdir(nume) Eliminați un director gol Opendir(nume) Deschide un director pentru citire readdir(dirpointer) Citiți următorul element dintr-un director Closedir(dirpointer) Închide un director chdir(dirname) Schimbați directorul curent în directorul numit dirname Iink(name , name ) Creați o asociere (nume intrare în director care indică directorul namel) unlink(name) Eliminați o legătură (element cale) dintr-un director Apelarea la nk creează o intrare de director care indică un fișier deja existent De exemplu, elementul /usr/jim/jotto poate fi creat prin apelare nk ("/usr/ast/Yn/game ", "/usr/jim/jotto") Capitolul Stratul sistemului de operare Același lucru se poate realiza cu un apel echivalent folosind căi relative care depind de directorul curent Apelul de deconectare elimină intrarea din director Dacă fișierul are un singur link, acesta este șters Dacă un fișier are două sau mai multe legături, atunci nu este șters Nu contează dacă legătura de la distanță a fost creată inițial sau dacă este o copie Următorul apel face fișierul date disponibil numai prin calea /usr/jim/jotto: unii nk ("/usr/ast/bip/date ") Apelurile nk și uni ink pot fi folosite pentru a muta fișiere dintr-un director în altul Fiecare fișier (și, de asemenea, fiecare director, deoarece un director este și un fișier) are asociat un bitmap care spune cui are permisiunea de a accesa fișierul Cardul conține trei câmpuri RWX (Read, Write, eXecute - citire, scriere, execuție) Primul dintre ei controlează permisiunea de a citi, scrie și executa fișiere pentru proprietarul lor, al doilea - pentru alți utilizatori din grupul proprietarului, al treilea - pentru toți ceilalți utilizatori De exemplu, biții RWX RX X înseamnă că proprietarul fișierului poate citi acest fișier, scrie ceva în el și îl poate executa (evident, fișierul este un program executabil, altfel nu ar exista permisiunea de a-l executa), alți membri ai grupului o pot citi și face, iar toți ceilalți doar o fac Astfel, utilizatorii neautorizați vor putea executa acest program, dar nu îl vor putea fura (copia), întrucât le este interzis să îl citească Includerea utilizatorilor în anumite grupuri este efectuată de administratorul de sistem, care este de obicei numit utilizator privilegiat Un utilizator privilegiat are dreptul de a acționa împotriva mecanismului de protecție și de a citi, scrie și executa orice fișier Acum să vedem cum sunt implementate fișierele și directoarele în sistemul UNIX Vezi [ ] pentru o descriere mai detaliată Fiecare fișier (și fiecare director, deoarece un director este și un fișier) are asociat un bloc de informații de de octeți numit inode (i-node) Inodul conține informații despre cine deține fișierul, ce este permis să facă cu fișierul, unde se găsesc date și așa mai departe Inodele pentru fișiere sunt localizate fie secvențial la începutul discului, fie, dacă discul este împărțit în grupuri de cilindri, la începutul grupului Inodele sunt prevăzute cu numere secvențiale Astfel, un sistem UNIX poate descoperi un i-node pur și simplu calculându-i adresa pe disc O intrare de director constă din două părți: un nume de fișier și un număr i-node Când programul execută următoarea comandă, sistemul caută în directorul curent al fișierului foo c pentru a găsi numărul inodul fișierului: openC'foo c", ) După ce a găsit numărul i-node, programul îl poate citi și afla toate informațiile despre fișier Dacă calea fișierului este mai lungă, procedura se repetă de mai multe ori până când întreaga cale a fost parcursă De exemplu, pentru a găsi numărul i-nodului pentru calea /usr/ast/data, sistemul va găsi mai întâi directorul rădăcină pentru elementul usr Odată ce găsește inodul usr, poate citi fișierul (directorul de pe sistem Exemple de sisteme de operare UNIX este, de asemenea, un fișier) În acest fișier, va căuta elementul ast și va găsi numărul i-node pentru fișierul /usr/ast Citind informațiile despre locație din directorul /usr/ast, sistemul va putea localiza intrarea pentru date și, prin urmare, numărul i-nodului pentru /usr/ast/data După ce a găsit numărul i-node pentru acest fișier, sistemul învață totul despre acest fișier Formatul, conținutul și plasarea inodurilor variază ușor de la sistem la sistem (mai ales când vine vorba de sistemele în rețea), dar următoarele elemente sunt prezente în aproape fiecare inod: ♦ tip de fișier, trei câmpuri RWX (total biți) și alți câțiva biți; ♦ numărul de legături cu fișierul (numărul de intrări în director); ♦ identificatorul proprietarului; ♦ grup de proprietari; ♦ lungimea fișierului în octeți; ♦ treisprezece adrese de disc; ♦ ora la care a fost citit ultima dată fișierul; ♦ ora la care a fost scris ultima dată dosarul; ♦ ora la care a fost schimbat ultima dată inodul Tipurile de fișiere pot fi diferite: fișiere obișnuite, directoare, două tipuri de fișiere speciale pentru dispozitive de I/O bloc și brute Am discutat deja despre numărul de link-uri și ID-ul proprietarului Lungimea fișierului este exprimată ca un număr întreg de de biți care indică cel mai semnificativ octet al fișierului Este perfect posibil să creați un fișier, să mutați indicatorul în poziția și să scrieți octet Rezultatul este un fișier cu o lungime de Cu toate acestea, acest fișier va necesita salvarea tuturor octeților "inexistenți" Primele adrese de pe disc indică blocuri de date Dacă dimensiunea blocului este de de octeți, atunci puteți lucra cu fișiere de până la de octeți Adresa AND indică un bloc indirect care conține de adrese de disc Aici puteți lucra cu fișiere de până la + x = octeți Pentru fișiere și mai mari, există adresa , care indică de blocuri indirecte Aici, dimensiunea permisă a fișierului este + x x = octeți Dacă această schemă de blocuri cu dublă indirectă este prea mică, se folosește adresa Ea indică blocul cu triplă indirectă, care conține adresele a de blocuri cu dublu indirectă Folosind adresarea directă, indirectă, dublă indirectă și triplă indirectă, pot fi accesate blocuri Aceasta înseamnă că dimensiunea maximă posibilă a fișierului este de de octeți Deoarece pointerii fișierelor sunt limitate la de biți, limita superioară reală a dimensiunii fișierului este de de octeți Blocurile de disc libere sunt stocate ca o listă legată Dacă este necesar un nou bloc, acesta este luat din listă Rezultatul este că blocurile fiecărui fișier sunt împrăștiate aleatoriu pe disc Pentru a îmbunătăți viteza I/O pe disc, trebuie să faceți următoarele După ce un fișier este deschis, inodul acestuia este copiat în tabelul principal Capitolul Stratul sistemului de operare memorie și este stocat acolo atâta timp cât fișierul rămâne deschis În plus, există un set de blocuri în memorie care au fost accesate recent Deoarece majoritatea fișierelor sunt citite secvențial, adesea un acces la fișier necesită același bloc ca și accesul anterior Pentru a crește viteza, sistemul citește următorul bloc într-un fișier chiar înainte de a fi accesat Toate aceste momente sunt ascunse utilizatorului Când utilizatorul face un apel pentru citire, programul se întrerupe până când datele solicitate sunt în buffer Știind toate acestea, puteți înțelege cum are loc procesul I/O Apelarea eagle face ca sistemul să caute directoare într-o anumită cale Dacă căutarea are succes, inodul este citit în tabelul intern Apelurile de citire și scriere necesită ca sistemul să calculeze numărul blocului din poziția curentă a fișierului Adresele primelor blocuri de disc sunt întotdeauna în memoria principală (inode); pentru blocurile rămase, trebuie mai întâi citite unul sau mai multe blocuri de adresare indirectă Apelul către Iseek schimbă pur și simplu poziția curentă a indicatorului și nu face I/O Primul argument pentru apelul de cerneală este numărul inodului La acel număr, creează o intrare de director pentru al doilea argument și plasează numărul i-node al primului fișier în acea intrare de director În cele din urmă, crește numărul de legături din inod cu Apelul uniink elimină intrarea în director și reduce numărul de legături din inod Dacă acest număr devine , fișierul este șters și toate blocurile sale sunt plasate pe lista liberă I/O virtuală în Windows XP Windows XP acceptă mai multe sisteme de fișiere, dintre care cele mai importante sunt NTFS (NT File System) și FAT (File Allocation Table) Primul a fost conceput special pentru Windows XP Al doilea este un sistem de fișiere moștenit pentru MS-DOS, care este folosit și de Windows / (deși cu nume de fișiere lungi) Deoarece sistemul FAT este învechit, vom lua în considerare doar sistemul de fișiere NTFS Pe NTFS, un nume de fișier poate avea până la de caractere Numele fișierelor sunt scrise în Unicode, astfel încât persoanele din diferite țări care nu folosesc alfabetul latin să poată scrie numele fișierelor în propria lor limbă În toate versiunile sistemului de operare, începând cu Windows , textele meniurilor, mesajele de eroare și alte elemente ale interfeței sunt stocate în fișiere de configurare alocate pentru fiecare limbă, în timp ce fișierele binare sunt aceleași pentru toate variantele mediului de limbă Pe NTFS, literele mari și mici din numele fișierelor sunt considerate diferite (adică "foo" este diferit de "FOO") Din păcate, API-ul Win nu face distincție între literele majuscule și mici în numele fișierelor și directoarelor, astfel încât acest avantaj este pierdut pentru programele care utilizează subsistemul Win Ca și în UNIX, un fișier este o secvență liniară de octeți, a cărei lungime maximă este de - Există și pointerii, dar lungimea lor nu este de , ci de de biți, astfel încât să puteți suporta maximul Exemple de sisteme de operare lungimea fișierului Apelurile de funcții din API-ul Win pentru manipularea directoarelor și fișierelor sunt în general similare cu apelurile de funcții UNIX, dar cele mai multe dintre ele au mai mulți parametri și un model de securitate diferit Când fișierul este deschis, este returnat un handle, care este apoi folosit pentru a citi și scrie fișierul Spre deosebire de UNIX, descriptorii nu sunt numere întregi mici, iar intrarea standard, ieșirea standard și eroarea standard nu sunt definite în prealabil ca , și (excepția este modul consolă) Principalele funcții API Win pentru gestionarea fișierelor sunt enumerate în Tabelul (a doua coloană oferă funcția UNIX echivalentă) Tabelul Funcții de bază Win API pentru fișiere I/O Funcția API Funcția UNIX Descriere CreateFile open Creați un fișier sau deschideți un fișier existent; funcția returnează mânerul DeleteFile deconectare Șterge un fișier existent CloseHandle close Închide un fișier ReadFile read Citirea datelor dintr-un fișier WriteFile write Scrie date într-un fișier SetFilePointer Iseek Setați un indicator de fișier la o locație dată dintr-un fișier SetFileAttributes stat Returnează proprietățile fișierului LockFile Fcntl Blocați o regiune a unui fișier pentru a oferi excluderea reciprocă a accesului UnlockFile Fcntl Deblochează o zonă blocată anterior a unui fișier Să aruncăm o privire asupra acestor provocări Apelul CreateFile este folosit pentru a crea un fișier nou și le returnează un handle Această funcție este folosită și pentru a deschide un fișier deja existent, deoarece nu există nicio funcție heads în API Nu vom enumera parametrii funcțiilor API, deoarece există o mulțime de ei De exemplu, funcția CreateFile are șapte parametri: ♦ pointer către numele fișierului creat sau deschis; ♦ steaguri care indică ce acțiuni pot fi efectuate asupra fișierului (citire, scriere sau ambele); ♦ steaguri care indică dacă mai multe procese pot deschide un fișier în același timp; ♦ un pointer către un descriptor de securitate care indică cine are acces la fișier; ♦ steaguri care indică ce trebuie făcut când fișierul există și când nu există; ♦ steaguri asociate atributelor de arhivare, compresie etc ♦ handle de fișier ale cărui atribute urmează să fie clonate pentru noul fișier Următoarele șase funcții API sunt similare cu funcțiile UNIX corespunzătoare Ultimele două vă permit să blocați sau să deblocați o regiune a unui fișier pentru a vă asigura că procesele nu pot accesa aceeași regiune Capitolul Stratul sistemului de operare Folosind aceste funcții API, puteți scrie o procedură de copiere a fișierelor similară cu procedura din lista O astfel de procedură (fără codul de verificare a erorilor) este prezentată în Lista În practică, nu este nevoie să scrieți un program pentru a copia un fișier, deoarece există o funcție CopyFile care face aproximativ același lucru și este implementată ca procedură de bibliotecă Lista - Un fragment de program pentru copierea unui fișier folosind funcția API a sistemului Windows XP Acest fragment este scris în C, deoarece Java nu poate afișa apelurile de sistem de nivel scăzut de care avem nevoie /* Deschide fișierele pentru intrare și ieșire */ Inhandle = CreateFIleC'data" GENERIC READ, Oh, NULL OPEN EXISTING, NULL); outhandle = CreateFileC'newF, GENERIC WRITE, , NULL, CREATE ALWAYS, FILE ATTRIBUTE NORMAL, NULL); /* Copiați fișierul */ face { s = ReadFilednhandle, buffer, BUF SIZE, &count, NULL); Dacă (s > && count > ) WriteF e(outhandle, buffer, count, &ocnt, NULL); } while (s > && count > ); /* Закрытие файлов */ CIoseHandle(inhandle); CloseHandle (mâner exterior); Windows XP acceptă un sistem de fișiere ierarhic similar cu sistemul de fișiere UNIX Cu toate acestea, separatorul de aici nu este o bară oblică înainte, ci o bară oblică inversă (împrumutat de la MS-DOS) Și aici există conceptul de director curent, iar căile pot fi absolute și relative Cu toate acestea, există o diferență semnificativă între Windows XP și UNIX UNIX vă permite să montați sisteme de fișiere de pe diferite discuri și mașini într-un singur arbore, ascunzând astfel structura discului de programe Windows XP nu are această capacitate, așa că numele absolute de fișiere trebuie să înceapă cu o literă de unitate (de exemplu, C:\windows\system\foo dll) În același timp, capacitatea de a monta sisteme de fișiere în stil UNIX a fost introdusă în Windows Principalele funcții pentru lucrul cu directoare sunt listate în Tabel (de asemenea, împreună cu echivalentele UNIX) Tabelul Funcțiile de bază ale Win API pentru lucrul cu directoare Funcția API Funcția UNIX Semnificație CreateDirectiry mkdir Creați un director nou RemoveDirectory rmdir Eliminați un director gol FindFirstFile opendir Începeți să citiți intrările din director FindNextFile readdir Citiți următoarea intrare dintr-un director MoveFile Mută un fișier dintr-un director în altul SetCurrentDirectory chdir Schimba directorul curent Windows XP are un mecanism de securitate mai sofisticat decât UNIX Când un utilizator se conectează, procesul său primește un token de acces de la sistemul de operare Exemple de sisteme de operare sistemul noah Indicatorul de acces conține un identificator de securitate (ID de securitate, SID), o listă de grupuri din care aparține utilizatorul, privilegii disponibile și alte informații Tokenul de acces concentrează toate informațiile de securitate într-un singur loc ușor accesibil Toate procesele create de acest proces moștenesc același simbol de acces Un descriptor de securitate este unul dintre parametrii dați oricărui obiect atunci când este creat Descriptorul de securitate conține o listă de elemente numită Listă de control al accesului (ACL) Fiecare element permite sau interzice un anumit set de operațiuni cu obiectul oricărui utilizator sau grup De exemplu, un fișier poate conține un descriptor de securitate care specifică că Ivanov nu are deloc acces la fișier, Petrov poate citi fișierul, Sidorov poate citi și scrie fișierul și toți membrii grupului XYZ pot citi doar dimensiunea de fișierul Dacă un proces încearcă să efectueze orice operațiune asupra unui obiect folosind mânerul primit la deschiderea obiectului, managerul de securitate obține jetonul de acces al procesului și începe să repete ACL în ordine De îndată ce găsește un element care se potrivește utilizatorului dorit sau unuia dintre grupuri, informațiile găsite despre permiterea sau refuzarea accesului sunt considerate ca date Din acest motiv, elementele care interzic accesul sunt de obicei plasate în lista de control al accesului înaintea elementelor care permit accesul (astfel încât un utilizator care nu are acces să nu poată obține acces ilegal fiind membru al unuia dintre grupurile cărora li se permite accesul) Descriptorul de securitate conține, de asemenea, informații utilizate pentru auditarea acceselor la obiect Acum să vedem cum sunt implementate fișierele și directoarele în Windows XP Fiecare disc este împărțit în volume, la fel ca și partițiile de disc UNIX Fiecare volum conține fișiere, hărți de biți de director și alte structuri de date Fiecare volum este organizat ca o secvență liniară de clustere Mărimea clusterului este fixă pentru fiecare volum Poate fi de la octeți la KB, în funcție de dimensiunea volumului Clusterul este accesat prin offset de la începutul volumului Aceasta utilizează numere pe de biți Structura principală de date din fiecare volum este Master File Table (MFT), care conține intrări pentru fiecare fișier și director din volum Aceste intrări sunt similare cu intrările inode (i-node) în UNIX Tabelul de fișiere master este un fișier și poate fi plasat oriunde într-un volum Aceasta rezolvă o problemă care apare atunci când se găsesc blocuri de disc proaste printre inoduri Tabelul principal al fișierelor este prezentat în fig Începe cu un antet care oferă informații despre volum (indicatori către directorul rădăcină, fișierul de descărcare, lista utilizatorilor gratuiti etc ) Apoi, există o intrare per fișier sau director ( KB dacă dimensiunea clusterului este de KB sau mai mult) Fiecare element conține toate metadatele (informații administrative) despre un fișier sau director Sunt permise mai multe formate, dintre care unul este prezentat în Fig Capitolul Stratul sistemului de operare Tabelul Master File (MFT) Orez Tabel de fișiere master în Windows XP Câmpul de informații standard conține informații despre marcajele de timp cerute de standardele POSIX, numărul de legături, biți de doar citire, biți de arhivare etc Acest câmp are o lungime fixă și este obligatoriu Numele fișierului poate avea orice lungime, până la de caractere Unicode Pentru a face astfel de fișiere accesibile pentru programele moștenite pe biți, li se poate atribui un alias MS-DOS de până la caractere, urmat de un punct și o extensie de caractere Dacă numele propriu-zis al fișierului urmează convenția de denumire MS-DOS ( + ), numele de mijloc în stil MS-DOS nu este utilizat Urmează domeniul de securitate În toate versiunile anterioare Windows NT , câmpul de securitate conținea un descriptor de securitate Începând cu Windows , toate informațiile de securitate sunt plasate într-un singur fișier, iar câmpul de securitate indică pur și simplu partea corespunzătoare a acelui fișier Pentru fișierele mici, datele reale ale acelor fișiere pot fi conținute într-o intrare de tabel de fișiere master, făcându-le mai ușor de apelat fără a necesita acces la disc Acest concept se numește fișierul imediat [ ] Pentru fișierele mari, acest câmp conține pointeri către grupuri de date sau (mai frecvent) blocuri de clustere consecutive, astfel încât numărul și lungimea clusterului pot reprezenta o cantitate arbitrară de date Dacă elementul tabelului de fișiere principal nu este suficient de mare pentru a stoca informațiile necesare, unul sau mai multe elemente suplimentare (înregistrări) îi pot fi asociate Dimensiunea maximă a fișierului este de de octeți Să explicăm ce este un fișier de această dimensiune Să ne imaginăm că fișierul este scris în sistem binar și fiecare sau ocupă mm de spațiu Valoarea de mm corespunde unei valori de ani lumină Acest lucru ar fi suficient pentru a trece dincolo de sistemul solar, a ajunge la Alpha Centauri și a reveni înapoi Sistemul de fișiere NTFS are multe alte caracteristici interesante, în special, acceptă comprimarea datelor și mecanismul de toleranță la erori bazat pe tranzacții atomice Informații suplimentare pot fi găsite în [ ] Exemple de sisteme de operare Exemple de control al procesului Sistemele Windows XP și UNIX permit ca munca să fie împărțită în mai multe procese care rulează în paralel și interacționează între ele, ca în exemplul producător/consumator despre care am discutat mai devreme În această subsecțiune, vom vorbi despre modul în care procesele sunt gestionate în ambele sisteme Ambele sisteme suportă paralelismul într-un singur proces folosind fire de execuție de program și vom vorbi și despre asta Managementul proceselor în UNIX În orice moment, un proces UNIX poate crea un subproces care este copia lui exactă Acest lucru se face folosind apelul de sistem fork Procesul inițial se numește părinte, iar cel nou se numește copil Cele două procese rezultate din apelul fork sunt exact identice și chiar împărtășesc aceiași descriptori de fișier Cu toate acestea, fiecare dintre aceste două procese își desfășoară activitatea independent de celălalt Adesea, procesul copil direcționează greșit descriptorii fișierelor într-un fel și apoi execută apelul de sistem exec, care înlocuiește programul și datele cu programul și datele din fișierul executabil specificat ca parametru pentru apelul exec De exemplu, dacă utilizatorul introduce comanda xyz, atunci interpretul de comandă (shell) efectuează o operație de furcăre, generând astfel un proces copil Și acest proces face un apel către exec pentru a rula programul xyz Aceste două procese rulează în paralel (cu sau fără apelul de sistem exec), dar uneori procesul părinte trebuie, dintr-un motiv oarecare, să aștepte ca procesul copil să-și termine activitatea înainte de a continua să facă ceva În acest caz, procesul părinte emite un apel de sistem wait sau waitpid, determinând suspendarea temporară și așteptarea până când procesul secundar emite apelul de sistem de ieșire Procesele se pot bifurca ori de câte ori doresc, rezultând un întreg arbore de proces Uită-te la fig Aici, procesul A s-a bifurcat de două ori și a generat două procese noi, B și C Apoi, procesul B s-a bifurcat de două ori și procesul C o dată Astfel, s-a obținut un arbore de șase procese Procesul sursă Procesele generate de procesul A Procese generate de procesele copil ale procesului A Orez Arborele de proces în sistemul UNIX Procesele din UNIX pot comunica între ele printr-o structură specială de informații numită conductă Canalul prezintă Capitolul Stratul sistemului de operare este un fel de buffer în care un proces scrie un flux de date, iar un alt proces preia aceste date de acolo Octeții sunt întotdeauna returnați de la canal în ordinea în care au fost scrisi Accesul aleatoriu nu este posibil Canalele nu păstrează granițele dintre fragmentele de date, așa că dacă un proces a scris fragmente de de octeți pe canal, iar un alt proces citește date de de octeți, atunci al doilea proces va primi toate datele simultan fără a indica faptul că au fost scrise în câțiva pași System V și Solaris folosesc o metodă diferită pentru comunicarea proceselor Aici sunt folosite așa-numitele cozi de mesaje Un proces poate crea o nouă coadă de mesaje sau poate deschide una existentă apelând msgget Mesajele sunt trimise folosind msgsnd și primite folosind msgrecv Mesajele trimise în acest fel sunt diferite de datele introduse într-un canal În primul rând, limitele mesajelor sunt păstrate în timp ce canalul pur și simplu transmite fluxul de date În al doilea rând, mesajele sunt prioritizate, așa că mesajele urgente vin înaintea tuturor celorlalte În al treilea rând, mesajele sunt tastate, iar apelarea msgrecv vă permite să determinați tipul lor, dacă este necesar Două sau mai multe procese pot împărtăși o zonă comună a spațiilor lor de adrese UNIX gestionează această memorie partajată prin maparea acelorași pagini la spațiul de adrese virtuale al tuturor proceselor partajate Ca rezultat, o scriere în zona partajată făcută de unul dintre procese va fi vizibilă pentru toate celelalte procese Acest mecanism oferă un debit foarte mare atunci când procesele interacționează O altă caracteristică a System V și Solaris este prezența semaforelor Am descris deja principiile muncii lor când am vorbit despre producător și consumator Sistemele UNIX pot suporta mai multe fire de control într-un singur proces Aceste fluxuri de control sunt de obicei denumite pur și simplu fluxuri de program Sunt ca procesele care partajează un spațiu de adrese comun și toate obiectele asociate cu acel spațiu de adrese (descriptori de fișiere, variabile de mediu etc ) Cu toate acestea, fiecare fir de execuție are propriul său numărător de programe, propriile registre și propriul său stack Dacă unul dintre firele de execuție a programului este suspendat (de exemplu, până la finalizarea unui proces I/O), alte fire de execuție a programului din același proces pot continua să ruleze Două fire de execuție de program din același proces care acționează ca un proces producător și un proces consumator seamănă cu două procese cu un singur thread care împart un segment de memorie care conține un buffer, deși nu sunt identice În al doilea caz, fiecare proces are propriii descriptori de fișier etc , în timp ce în primul caz, toate aceste elemente sunt comune În exemplul producător-consumator, am văzut cum funcționează firele în Java Uneori, sistemul de rulare Java folosește un fir de execuție al sistemului de operare pentru a suporta fiecare dintre fire, dar acest lucru nu este necesar Când ai putea avea nevoie de fire de execuție de program? Luați în considerare un server web Un astfel de server poate stoca un cache de pagini web accesate frecvent în memoria principală Dacă pagina dorită se află în cache, atunci aceasta este emisă imediat Dacă nu, este apelat de pe disc Din păcate, acest lucru durează destul de mult (de obicei de milisecunde), pentru acest timp Exemple de sisteme de operare procesul este blocat și nu poate servi cereri noi, chiar dacă paginile web solicitate sunt în cache Pentru a rezolva problema, puteți crea mai multe fire în același proces care partajează un cache comun al paginii web Dacă unul dintre firele de execuție a programului este blocat, cererile noi pot fi procesate de alte fire de execuție a programului De asemenea, puteți preveni blocarea procesului fără a utiliza fire Acest lucru va necesita mai multe procese, dar apoi va trebui să duplicați memoria cache, ceea ce este oarecum risipitor, deoarece memoria este limitată Standardul de sistem UNIX pentru firele de execuție se numește pthreads și este definit în POSIX (P C) Descrie apeluri pentru gestionarea și sincronizarea firelor de execuție a programului Standardul nu spune dacă firele de execuție ar trebui gestionate de kernel sau ar trebui să funcționeze numai în spațiul utilizatorului Cele mai comune funcții pentru lucrul cu firele de execuție ale programului sunt prezentate în tabel Tabelul - Funcții de bază pentru lucrul cu firele de execuție definite în standardul POSIX Descrierea funcției pthread create Creați un nou thread de program în spațiul de adrese al procedurii de apelare pthread exit Închide un fir de execuție al unui program pthreadjoin Așteptați ca un fir de program să se termine pthread mutex init Creați un nou mutex pthread mutex destroy Eliminarea unui mutex pth read m utex l oc k Blocare mutex pthread mutex unlock Deblochează un mutex pthread-CondJnit Crearea unei variabile de condiție pthread cond destroy Ștergerea unei variabile de condiție pthread cond wait Așteptați o variabilă de condiție pthread cond signal Deblocați unul dintre firele de execuție care așteaptă o variabilă de condiție Să aruncăm o privire asupra acestor provocări Primul apel, pthreadcreate, creează un nou thread de program După executarea acestei proceduri, în spațiul de adrese mai apare un fir de program Firul programului care și-a făcut treaba apelează funcția pthreadexit Dacă un thread trebuie să aștepte ca un alt thread să se termine, apelează funcția pthreadjoin Dacă celălalt thread și-a terminat deja lucrul, apelul la pthread join se încheie imediat În caz contrar, este blocat Firele de execuție ale programului pot fi sincronizate folosind obiecte speciale numite mutex De obicei, un mutex controlează un fel de resursă (de exemplu, un buffer partajat între două fire de execuție a programului) Pentru a vă asigura că numai un fir de execuție poate accesa o resursă partajată la un moment dat, firele de execuție trebuie să blocheze mutex-ul înainte de a utiliza resursa și să o deblocheze când au terminat Capitolul Stratul sistemului de operare lucra cu el În acest fel, condițiile de cursă pot fi evitate, deoarece toate firele de execuție se supun acestui protocol Mutexurile sunt similare cu semaforele binare (adică semaforele care pot lua doar două valori: sau ) Mutexurile pot fi create și distruse prin apeluri la pthreadmutexinit și, respectiv, pthreadmutexdestroy Un mutex poate fi în una din două stări: blocat sau deblocat Dacă un fir de execuție trebuie să blocheze un mutex deblocat, efectuează un apel către pthread mutexlock și apoi continuă Totuși, dacă un fir de execuție încearcă să blocheze un mutex deja blocat, firul de execuție este suspendat Când firul de execuție care utilizează în prezent resursa partajată a terminat de utilizat acea resursă, trebuie să deblocheze mutex-ul corespunzător apelând pthreadmutexunl ock Mutexurile sunt concepute pentru blocarea pe termen scurt (de exemplu, protejarea unei variabile partajate), dar nu pentru sincronizare pe termen lung (de exemplu, așteptarea ca o unitate de bandă să devină liberă) Pentru sincronizarea pe termen lung, există variabile de condiție Aceste variabile sunt create și șterse prin apeluri către pthreadcondinit și, respectiv, pthreadconddestroy O variabilă de condiție este asociată cu două fire de program: așteptare și semnalizare Dacă, de exemplu, un fir detectează că unitatea de bandă de care are nevoie este ocupată în prezent, acel fir emite un apel către pthreadcondwait pe variabila condiție Când un fir care folosește o unitate de bandă își încheie lucrul cu acest dispozitiv (și poate dura câteva ore), acesta semnalează acest lucru apelând pthreadcondsignal Acest lucru permite deblocarea exact unui fir - cel care așteaptă această variabilă de condiție Dacă nu există fire care să aștepte această variabilă, semnalul dispare Variabilele de condiție nu au un numărător, așa cum au semaforele Rețineți că alte operațiuni pot fi efectuate pe fire, mutex și variabile de condiție Managementul proceselor în Windows XP Windows XP acceptă mai multe procese care pot interacționa și sincroniza Fiecare proces conține cel puțin un fir de program, care, la rândul său, conține cel puțin un fir ușor, sau fibră Procesele, firele și fibrele sunt instrumente colective pentru menținerea concurenței în sistemele cu un singur procesor și multiprocesor Procesele noi sunt create folosind funcția CreateProcess API Această funcție are argumente, fiecare cu mai mulți parametri Evident, un astfel de sistem este mult mai complicat decât schema UNIX corespunzătoare, unde funcția fork nu are deloc argumente, iar exec are doar trei dintre ele: pointeri către numele fișierului executabil, către o serie de opțiuni ale liniei de comandă, și la o linie de descriere a configurației Cele argumente ale funcției CreateProcess sunt enumerate mai jos: ♦ pointer către numele fișierului executabil; ♦ linia de comandă propriu-zisă (fără parsing); + pointer către descriptorul de securitate al acestui proces; Exemple de sisteme de operare + pointer către descriptorul de securitate al firului original al programului; + un pic care spune dacă noul proces moștenește mânerele de proces ale părintelui; + diverse steaguri (de ex erori, prioritate, depanare, console); + pointer către liniile de descriere a configurației; + pointer către numele directorului de lucru al noului proces; + un pointer către o structură care descrie fereastra sursă de pe ecran; + pointer către o structură care returnează valori la procedura de apelare În Windows XP, nu există o ierarhie a proceselor părinte-copil Toate procesele sunt create egale Cu toate acestea, deoarece unul dintre cei parametri returnați la procesul inițial este mânerul noului proces (care permite controlul noului proces), există o ierarhie internă în sensul că anumite procese conțin mânere către alte procese Aceste mânere nu pot fi pur și simplu trecute direct către alte procese, dar un proces poate face un anumit mâner disponibil altui proces și apoi să îi transmită acel mâner, astfel încât ierarhia internă a procesului să nu poată persista mult timp Fiecare proces din Windows XP este creat cu un singur thread, dar procesul poate crea ulterior mai multe fire Crearea unui fir de execuție de program este mai ușoară decât crearea unui proces, deoarece apelul CreateThread are doar parametri în loc de : descriptor de securitate, dimensiunea stivei, adresa de pornire, parametrul utilizatorului, starea inițială a firului (gata sau blocată) și ID-ul firului Deoarece nucleul este responsabil pentru crearea firelor de execuție, are informații despre toate firele de execuție a programului (cu alte cuvinte, implementarea lor nu se limitează la spațiul utilizatorului, ca în alte sisteme) Când nucleul efectuează o sincronizare, apelează nu numai procesul care ar trebui să ruleze în continuare, ci și firul de execuție al procesului respectiv Aceasta înseamnă că nucleul știe întotdeauna ce fire de execuție de program sunt blocate și care nu Deoarece firele de execuție sunt obiecte kernel, au descriptori și mânere de securitate Deoarece descriptorilor li se permite să fie transmise unui alt proces, este posibil ca un proces să gestioneze fluxurile de program ale altui proces Această caracteristică poate fi necesară, de exemplu, pentru depanatoare Crearea de fire de execuție în Windows XP este destul de irosită, deoarece necesită să introduceți nucleul și apoi să îl ieșiți Pentru a evita acest lucru, Windows XP furnizează fibre, care sunt similare cu firele de execuție ale programului, dar rulate și sincronizate în spațiul utilizatorului de către programul care le creează Fiecare fir poate avea mai multe fibre, la fel ca un proces poate avea mai multe fire, doar in acest caz, cand o fibra este blocata, aceasta intra in coada de fibre blocate si alege alta fibra care sa ruleze pe firul ei Nucleul nu știe despre această tranziție, deoarece firul continuă să ruleze, chiar dacă mai întâi a rulat o fibră și apoi alta Capitolul Stratul sistemului de operare Nucleul gestionează procesele și firele de execuție, dar nu gestionează fibrele Fibrele pot fi utile, de exemplu, atunci când programele care au fire proprii sunt portate în Windows XP Procesele pot comunica între ele în mai multe moduri: prin conducte, conducte numite, sloturi de e-mail, socketuri, apeluri de procedură la distanță, fișiere partajate Există două tipuri de canale: octeți și mesaje Tipul este selectat în momentul creării Byte pipes funcționează la fel ca în UNIX Canalele de mesaje păstrează limitele mesajelor, astfel încât patru înregistrări de de octeți sunt citite de pe canal ca patru mesaje de de octeți (mai degrabă decât un mesaj de de octeți, așa cum este cazul canalelor de octeți) În plus, există țevi numite, care vin și în două soiuri Conductele denumite pot fi utilizate în rețea, dar conductele normale nu Sloturile de e-mail (mailslot) sunt un atribut exclusiv al Windows XP (nu există niciunul în UNIX) Sunt asemănătoare canalelor în multe privințe, deși nu în toate privințele În primul rând, sunt unilaterale, iar canalele sunt cu două fețe Pot fi folosite online, dar nu garantează livrarea În cele din urmă, acceptă difuzarea mesajelor către mai mulți destinatari, nu doar către unul singur Prizele sunt similare cu țevile, dar de obicei conectează procese pe mașini diferite, deși pot fi folosite și pentru a conecta procese pe aceeași mașină În general, o conexiune priză nu este cu mult mai bună decât o conexiune obișnuită sau numită Apelurile de procedură de la distanță permit procesului A să instruiască procesul B să efectueze un apel de procedură în spațiul de adrese B în numele lui A și să returneze rezultatul procesului A Există diverse restricții privind parametrii apelului De exemplu, trecerea unui pointer către un alt proces nu are niciun sens În cele din urmă, procesele pot partaja memoria partajată prin maparea simultană a aceluiași fișier în memorie Apoi, toate înregistrările generate de un proces vor apărea în spațiul de adrese al altor procese Folosind acest mecanism, se poate implementa cu ușurință un buffer partajat (partajat), pe care l-am descris în exemplu cu procesul producător și procesul consumator Windows XP oferă multe mecanisme de sincronizare (semafore, mutexuri, secțiuni critice, evenimente) Toate aceste mecanisme nu funcționează cu procese, ci cu fire de execuție de program, așa că atunci când un fir de execuție se blochează pe un semafor, nu afectează în niciun fel alte fire de execuție ale acestui proces - ele continuă să funcționeze Un semafor este creat folosind funcția CreateSemaphore API, care îl poate seta la o anumită valoare și poate determina valoarea maximă a acestuia Semaforele sunt obiecte kernel, deci au descriptori de securitate și mânere Un mâner de semafor poate fi duplicat folosind funcția DuplicateHandle și transmis unui alt proces, astfel încât un singur semafor poate sincroniza mai multe procese Sunt acceptate și funcțiile sus și jos, deși au denumiri diferite: ReleaseSemaphore (pentru sus) și WaitForSingleObject (pentru jos) Puteți defini o limită de timp inactiv pentru funcția WaitForSingleObject, astfel încât firul apelant să poată fi deblocat în cele din urmă chiar dacă semaforul rămâne la (cu toate acestea, cronometrele contribuie la condițiile de cursă) Rezumatul capitolului Mutexurile sunt, de asemenea, obiecte nucleu, dar sunt mai simple decât semaforele deoarece nu au contor Sunt, de fapt, obiecte cu funcții API pentru blocare (WaitForSingleObject) și deblocare (ReleaseMutex) Mânerele Mutex, precum mânerele semaforului, pot fi duplicate și transmise altor procese, astfel încât firele din procese diferite să poată accesa același mutex Al treilea mecanism de sincronizare se bazează pe secțiuni critice Secțiunile critice sunt similare cu mutexurile, cu excepția localității lor în ceea ce privește spațiul de adresă al firului de execuție original al programului Deoarece secțiunile critice nu sunt obiecte kernel, ele nu au mânere sau descriptori de securitate, deci nu pot fi transmise altor procese Blocarea și deblocarea se realizează folosind funcțiile EnterCriticalSection și, respectiv, LeaveCriticalSection Deoarece aceste funcții API rulează în întregime în spațiul utilizatorului, sunt mult mai rapide decât mutexurile Ultimul mecanism este legat de utilizarea obiectelor kernel, care se numesc evenimente Dacă un fir trebuie să aștepte un eveniment, apelează WaitForSingleObject Puteți folosi funcția SetEvent pentru a debloca un fir în așteptare și puteți folosi funcția PulseEvent pentru a debloca toate firele în așteptare Există mai multe tipuri de evenimente care au mai mulți parametri Evenimentele, mutexurile și semaforele pot fi denumite în mod specific și stocate în sistemul de fișiere ca conducte numite Puteți sincroniza activitatea a două sau mai multe procese prin deschiderea aceluiași eveniment, mutex sau semafor În acest caz, nu trebuie să creeze un obiect și apoi să dubleze mânerele, deși această abordare este, de asemenea, posibilă Rezumatul capitolului Sistemul de operare poate fi gândit ca un interpret pentru anumite caracteristici arhitecturale care nu există la nivelul arhitecturii de comandă Principalele dintre acestea sunt memoria virtuală, instrucțiunile I/O virtuale și suportul de concurență Memoria virtuală este necesară pentru a permite programelor să utilizeze mai mult spațiu de adrese decât are mașina de fapt sau pentru a oferi un mecanism convenabil pentru protejarea și partajarea memoriei Memoria virtuală poate fi implementată prin paginare "pură", segmentare "pură" sau ambele Cu memoria de paginare, spațiul de adrese este împărțit în pagini virtuale de dimensiuni egale Unele dintre ele sunt mapate pe cadre de pagină fizice, altele nu Referința la pagina mapată este tradusă de managerul de memorie în adresa fizică corectă Accesarea unei pagini nemapate cauzează o eroare de ieşire a paginii Pentium și UltraSPARC III au manageri de memorie sofisticați care acceptă memoria virtuală și paginarea Cea mai importantă abstractizare I/O la acest nivel este fișierul Un fișier constă dintr-o secvență de octeți, sau înregistrări logice, care pot fi Capitolul Stratul sistemului de operare citiți și scrieți fără a ști cum funcționează discurile și alte dispozitive I/O Fișierele pot fi accesate secvențial, non-secvențial după numărul de înregistrare și non-secvențial prin tastă Directoarele sunt folosite pentru a grupa fișiere Fișierele pot fi stocate în sectoare consecutive sau pot fi împrăștiate pe disc În acest din urmă caz, sunt necesare structuri speciale de date pentru a găsi toate blocurile din fișier Puteți utiliza o listă de goluri (zone neutilizate) sau un bitmap (bitmap) pentru a urmări spațiul liber de pe un disc Paralelismul este adesea susținut și implementat în sistemele uniprocesor prin partajarea timpului, care este modul în care sunt modelate procesoarele multiple Interacțiunea necontrolată a diferitelor procese poate duce la o condiție de rasă Pentru a le evita, sunt introduse mijloace speciale de sincronizare Cele mai simple dintre acestea sunt semaforele UNIX și Windows XP sunt sisteme de operare complexe Ambele sisteme acceptă paginarea și maparea memoriei fișierelor În plus, acceptă sisteme de fișiere ierarhice, în care fișierele sunt alcătuite dintr-o secvență de octeți În cele din urmă, ambele sisteme suportă procese și fire și oferă mecanisme pentru sincronizarea acestora Întrebări și sarcini De ce sistemul de operare interpretează doar unele dintre comenzile de nivelul (vezi Figura ), în timp ce firmware-ul interpretează toate comenzile de la nivelul arhitecturii instrucțiunilor? Mașina conține un spațiu de adrese virtuale de de biți adresat de octeți Dimensiunea paginii este de KB Câte pagini de spațiu de adrese virtuale există? Ar trebui ca dimensiunea paginii să fie o putere de doi? Este teoretic posibil să se implementeze o pagină de, să zicem, de octeți? Dacă da, cât de mult este justificată această dimensiune? Memoria virtuală conține pagini virtuale și cadre de pagină fizice Dimensiunea paginii este de de cuvinte Tabelul de pagini corespunzător arată ca Tabel Tabelul Tabel de pagini pentru job Pagina virtuală Cadru de pagină unsprezece Nu se află în memoria principală Nu se află în memoria principală Nu în memoria principală Nu în memoria principală Întrebări și sarcini ) Creați o listă de adrese virtuale care vor cauza o eroare a paginii atunci când sunt accesate ) Care sunt adresele fizice pentru adresele virtuale , , , , , și ? Computerul are pagini de spațiu de adrese virtuale și doar cadre de pagină Inițial, memoria este goală Programul accesează paginile virtuale în următoarea ordine: , , , , , , , , ) Care dintre apelurile algoritmului LRU va cauza o eroare a paginii? ) Care dintre accesările FIFO va cauza o eroare a paginii? În subsecțiunea "Politica de înlocuire a paginii" a secțiunii "Memorie virtuală", a fost propus un algoritm de înlocuire a paginii FIFO Dezvoltați un algoritm mai eficient Sfat', puteți actualiza contorul în pagina nou încărcată, lăsând toate celelalte În sistemele de paginare pe care le-am discutat în acest capitol, gestionarea erorilor de pagină a făcut parte din stratul arhitecturii de instrucțiuni și, prin urmare, nu este prezent în spațiul de adrese al sistemului de operare În practică, un astfel de handler ocupă unele pagini și poate fi eliminat în anumite circumstanțe (de exemplu, în conformitate cu politica de înlocuire a paginii) Ce s-ar întâmpla dacă gestionarea erorilor nu era disponibilă în momentul în care a apărut eroarea? Cum se rezolvă această problemă? Nu toate computerele conțin un bit special care este setat automat atunci când o pagină este scrisă Cu toate acestea, trebuie să urmăriți cumva paginile modificate, astfel încât să nu fie nevoie să scrieți toate paginile înapoi pe disc după ce le utilizați Presupunând că fiecare pagină are biți speciali pentru permisiuni de citire, scriere și executare, cum poate sistemul de operare să țină evidența paginilor care s-au schimbat și care nu? Memoria segmentată conține segmente de pagină Fiecare adresă virtuală conține un număr de segment de biți, un număr de pagină de biți și un offset de biți AND în cadrul paginii Memoria principală conține KB, care sunt împărțite în pagini de KB Fiecare segment poate fi doar citire, citire și execuție, citire-scriere sau citire-scriere-executare Tabelele de pagini și variantele de protecție sunt rezultate în tab Calculați adresa fizică pentru fiecare dintre cele enumerate în tabel opțiuni pentru accesarea memoriei virtuale Dacă apare o eroare, indicați ce tip este Unele computere permit I/O direct în spațiul utilizatorului De exemplu, un program poate începe să transfere date de pe disc pe un buffer în interiorul unui proces utilizator Va cauza acest lucru probleme dacă compactarea este utilizată pentru a implementa memoria virtuală? Argument Capitolul Stratul sistemului de operare Tabelul Tabelele de pagini pentru job Segmentul Segmentul Segmentul Segmentul Numai citire Citire și executare Citire, Citire și scriere Pagina virtuală Cadru de pagină Pagina virtuală Cadru de pagină Înregistrare și execuție Pagina virtuală Cadru de pagină Pe disc Nici un tabel de pagini în memoria principală Tabelul de pagini nu este în memoria principală Pe disc Tabelul de pagini nu este în memoria principală Tabelul de pagini nu este în memoria principală Pe disc Tabelul Opțiuni pentru accesarea memoriei virtuale pentru job Accesați Segment Page Offset în cadrul paginii Apel de date Apel de date Apel de date Salvați datele Salvați datele Salvați datele Tranziția Apel de date Apel de date Tranziție I Sistemele de operare care pot utiliza fișiere mapate în memorie necesită întotdeauna afișarea fișierelor în limitele paginii De exemplu, dacă avem pagini de K, fișierul poate fi redat începând de la adresa virtuală și nu de la adresa virtuală De ce este necesar acest lucru? La încărcarea unui registru de segment în Pentium , este apelat descriptorul corespunzător, care este încărcat în partea invizibilă a registrului de segment De ce crezi că dezvoltatorii Intel au decis să facă asta? Un program de pe un computer Pentium accesează segmentul local la offset Câmpul BAZ al segmentului din tabelul descriptor local conține numărul Ce intrare în tabelul de pagini folosește Pentium ? Care este numărul paginii? Care este compensarea? Luați în considerare posibili algoritmi pentru ștergerea segmentelor din memoria segmentată nepaginată Întrebări și sarcini Comparați fragmentarea internă cu fragmentarea externă Ce se poate face pentru a evita fiecare dintre ele? Supermarketurile se confruntă adesea cu o problemă similară cu mecanismul de înlocuire a paginilor din sistemele de memorie virtuală Supermarketurile au o zonă fixă de spațiu pe rafturi unde trebuie plasate tot mai multe articole Dacă sosește un produs nou important, cum ar fi hrana pentru câini de foarte înaltă calitate, un alt produs trebuie îndepărtat pentru a face loc noului produs Cunoaștem doi algoritmi: LRU și FIFO Pe care il preferi? Într-un fel, tehnologiile de stocare în cache și de paginare în memorie sunt similare între ele În ambele cazuri, memoria este împărțită în două regiuni (cache și memoria principală într-un caz și memoria principală și pe disc în celălalt) Textul din acest capitol argumentează atât pentru dimensiunile de pagină mari, cât și pentru cele mici Sunt aceste argumente valide pentru dimensiunile liniei de cache? De ce multe sisteme de fișiere necesită ca un fișier să fie deschis în mod explicit de apelul de sistem Eagle înainte de a fi citit? Comparați utilizarea unui bitmap și a unei liste de goluri pentru a ține evidența spațiului liber de pe un disc Discul este format din de cilindri, fiecare având piste de de sectoare Câte goluri (fragmente neutilizate) vor fi necesare pentru ca lista lor să fie mai mare decât bitmap-ul? Se presupune că blocul de alocare este un sector și sunt necesari de biți pentru a stoca informații despre fiecare fragment neutilizat din lista nulă Pentru a face predicții despre performanța discului, trebuie să aveți un model de alocare a memoriei Să presupunem că discul este văzut ca un spațiu de adrese liniar de N sectoare (W " ) Aici, mai întâi există o secvență de blocuri de date, apoi spațiu neutilizat, apoi o altă secvență de blocuri de date și așa mai departe numărul de goluri pe disc? Pe o anumită mașină, un program poate crea câte fișiere are nevoie și toate fișierele pot crește în dimensiune în timp ce programul rulează, fără ca sistemul de operare să primească informații suplimentare despre dimensiunea lor finală Crezi că fișierele vor fi stocate în sectoare consecutive? Explica Potrivit unui studiu al diferitelor sisteme de fișiere, mai mult de jumătate dintre fișiere ocupă mai puțin de câțiva kiloocteți de spațiu pe disc, marea majoritate fiind mai puțin de KB Pe de altă parte, % (cantitativ) din toate fișierele ocupă de obicei mai mult de % din spațiul pe disc utilizat Ce concluzie despre dimensiunea blocurilor de disc se poate trage din aceste date? Luați în considerare una dintre metodele de implementare a comenzilor pentru lucrul cu semafoare Ori de câte ori CPU este pe cale să execute o comandă sus sau jos pe un semafor (un semafor este o variabilă întreagă în memorie), Capitolul Stratul sistemului de operare mai întâi setează prioritatea CPU în așa fel încât să blocheze toate întreruperile Apoi apelează semaforul din memorie, îl modifică și sare în funcție de valoarea lui După aceea, reactivează întreruperile Va funcționa această metodă dacă: ) Există un singur procesor care comută între procese la fiecare de milisecunde? ) cele două procesoare au o memorie comună unde se află semaforul? O companie de sistem de operare primește plângeri de la clienții săi cu privire la cea mai recentă dezvoltare care acceptă operațiunile cu semafor Clienții au decis că este imoral ca procesele să-și suspende munca (adică somnul la locul de muncă) Pentru a-și mulțumi clienții, compania a decis să adauge o a treia operațiune, rack Această operație pur și simplu verifică semaforul, dar nu îl schimbă și nici nu blochează procesul Astfel, programele verifică mai întâi dacă semaforul poate fi jos Va funcționa această idee dacă există trei sau mai multe procese care rulează pe semafor? Ce se întâmplă dacă există două procese? Realizați un tabel care să arate, în funcție de timp de la la milisecunde, care dintre cele trei procese, PI, P și P , rulează și care sunt blocate Toate cele trei procese execută comenzile sus și jos pe același semafor Dacă două procese sunt blocate și este executată o comandă ip, atunci procesul cu un număr mai mic este pornit, adică P are prioritate față de P și P etc Inițial, toate cele trei procese rulează, iar valoarea semaforului este + La t = , P efectuează operația de jos ♦ La t = , P efectuează operația de jos ♦ La t = Р efectuează operația ip + La t = RZ efectuează operația de jos + La t = , P efectuează operația de jos + La t = Р efectuează operația ip ♦ La t = , P efectuează operația de jos + La t = Р efectuează operația ip + La t = Р efectuează operația ip Un sistem de rezervare a unei companii aeriene trebuie să se asigure că, în timp ce un proces utilizează un fișier, niciun alt proces nu poate utiliza fișierul În caz contrar, două procese diferite care funcționează pentru două agenții de bilete diferite vor putea vinde ultimul loc rămas la doi pasageri Dezvoltați o metodă de sincronizare folosind semafore pentru a vă asigura că doar un proces la un moment dat poate accesa un fișier (presupunând că procesele respectă anumite reguli) Pentru a face posibilă implementarea semaforelor pe un computer cu mai multe procesoare și memorie partajată, dezvoltatorii includ adesea o instrucțiune de verificare cu blocare (să-i spunem TSL) în mașină Echipa TSL X Prove Întrebări și sarcini Setează celula X Dacă conținutul celulei este , semaforele sunt setate la într-un ciclu de memorie indivizibil și următoarea instrucțiune este omisă Dacă conținutul celulei nu este , TSL funcționează ca o operație nulă Folosind comanda TSL, puteți scrie procedurile osc și debloca cu următoarele proprietăți: Procedura osc(x) verifică dacă variabila x este blocată Dacă nu, această procedură blochează x și revine; procedura uni osc va elibera blocarea existentă Dacă variabila x este deja blocată, procedura așteaptă pur și simplu până când este liberă înainte de a bloca x și a reveni Dacă toate procesele blochează tabelul de semafor înainte de a-l folosi, atunci doar un proces poate opera pe variabile și pointeri la un moment dat, ceea ce previne condițiile de cursă Scrieți procedurile osk și deblocați în assembler (Puteți face orice presupuneri rezonabile necesare pentru a rezolva problema ) Care vor fi valorile ip și out pentru un buffer de inel de de cuvinte după fiecare dintre următoarele operații? Inițial, valorile ip și out sunt ) de cuvinte sunt tamponate; ) cuvinte sunt eliminate din buffer; ) de cuvinte sunt tamponate; ) cuvinte sunt eliminate din buffer; ) cuvinte sunt tamponate; ) de cuvinte sunt eliminate din buffer; ) cuvinte sunt tamponate; ) cuvinte sunt eliminate din buffer Să presupunem că o versiune de UNIX utilizează blocuri de KB și stochează adrese de disc pe bloc de adrese indirecte (adresă indirectă obișnuită, dublă și triplă) Care va fi dimensiunea maximă a fișierului? Se presupune că indicatorii de fișiere sunt de de biți Să presupunem că următorul apel de sistem UNIX este executat în contextul fig : uni nk('Vusr/ast/bi n/game ") Descrieți în detaliu ce modificări vor avea loc în sistemul de directoare Imaginați-vă că trebuie să dezvoltați un sistem asemănător UNIX pentru un microcomputer în care memoria principală nu este suficientă După ce a rulat o perioadă lungă de timp, sistemul încă nu se potrivește în memorie și alegeți aleatoriu o funcție de sistem pe care să o sacrifici pentru binele mai mare Fie această funcție pipe, care creează conducte pentru transferul fluxurilor de octeți de la un proces la altul Este posibil să schimbi cumva intrarea-ieșire după aceea? Ce poți spune despre conducte? Luați în considerare problemele și soluțiile posibile Comisia de protecție a descriptorilor de fișiere a protestat împotriva sistemului UNIX deoarece, atunci când returnează un descriptor de fișier, acesta returnează întotdeauna cel mai mic număr liber în prezent urmă Capitolul Stratul sistemului de operare De fapt, este puțin probabil ca descriptorii de fișiere cu numere mari să fie utilizați deloc Comitetul insistă ca sistemul să returneze cel mai mic descriptor numerotat dintre cei care nu au fost încă utilizați de program și nu dintre cei care sunt liberi în acest moment Comisia susține că această idee este ușor de pus în aplicare, nu va afecta programele existente și este, de asemenea, mult mai corectă pentru descriptori Ce părere ai despre această? În Windows XP, puteți crea o listă de control al accesului, astfel încât Svetlana să nu aibă acces la niciunul dintre fișiere, iar toți ceilalți să aibă acces deplin la ele Cum să o facă? Descrieți două moduri de a programa producătorul și consumatorul în Windows XP: folosind tampoane și semafoare partajate Gândiți-vă la modul în care puteți implementa un buffer partajat în fiecare dintre cele două cazuri Performanța algoritmilor de înlocuire a paginii este de obicei testată prin simulare Să presupunem că doriți să scrieți un simulator care implementează memoria virtuală paginată pentru o mașină cu de pagini de K Programul trebuie să mențină un tabel de de elemente, un element pe pagină Fiecare element de tabel conține numărul fizic al paginii care corespunde paginii virtuale date Simulatorul trebuie să citească un fișier care conține adrese virtuale în notație zecimală, o adresă pe linie Dacă pagina corespunzătoare este în memorie, doar înregistrați faptul că pagina există Dacă nu este în memorie, apelați procedura de înlocuire a paginii pentru a selecta o pagină care poate fi ștearsă (adică, suprascrieți o intrare în tabel) și înregistrați faptul că pagina lipsește Nu este nevoie să implementați niciun transfer de pagină Creați un fișier format din adrese neconsecutive și testați performanța a doi algoritmi: LRU și FIFO Acum creați un fișier de adrese în care x% dintre adrese sunt cu octeți mai mari decât cele anterioare Rulați teste pentru diferite valori ale lui x și raportați rezultatele În programul prezentat în Listarea , apare o cursă fatală deoarece două fire de execuție de program accesează variabilele partajate în mod necontrolat Aceasta nu implică semafore sau alte tehnici de excludere reciprocă Rulați acest program și veți vedea că se va bloca după un timp Dacă tot nu se blochează, încercați să faceți codul mai vulnerabil plasând câteva calcule între operatorii de ajustare a valorii m in și m out și operatorii lor de verificare Cât de mult calcul ar trebui pus în acest program, astfel încât să se blocheze, să zicem, o dată pe oră? Scrieți un program UNIX sau Windows XP care ia ca intrare un nume de director Programul ar trebui să imprime o listă de fișiere din acest director, fiecare fișier pe o linie separată, iar după numele fișierului - dimensiunea acestuia Numele fișierelor trebuie să fie în ordinea în care apar în director Sloturile neutilizate din directoare ar trebui să fie afișate cu un semn (neutilizat) Capitolul Nivel de asamblare În capitolele , și , am discutat despre cele trei niveluri care pot fi găsite în arhitectura majorității computerelor moderne În acest capitol, vom vorbi despre un alt nivel, care este prezent și în arhitectura aproape tuturor mașinilor moderne Acesta este nivelul de asamblare Acest nivel diferă semnificativ de precedentul trei, deoarece este implementat prin traducere, nu prin interpretare Pentru a traduce programele utilizatorului dintr-un limbaj de programare în altul, au fost dezvoltate programe speciale, care se numesc traducători Limba în care a fost scris inițial programul se numește limba de intrare sau sursă, iar limba în care este tradus se numește ieșire sau țintă Atât limbajele de intrare, cât și limbile de ieșire determină conținutul nivelurilor ierarhice Dacă există un procesor care poate executa programe scrise în limba sursă, atunci nu este nevoie să traduceți programul sursă într-o altă limbă Traducerea este necesară dacă există un procesor (hardware sau software) pentru limba de ieșire, dar niciun procesor pentru limba de intrare Dacă traducerea se face corect, atunci programul tradus va da exact aceleași rezultate ca și originalul (dacă ar exista un procesor potrivit pentru el) Prin urmare, este posibil să se organizeze un nou strat, care va traduce mai întâi programele scrise pentru stratul de ieșire, apoi le va executa singur Este important să înțelegem diferența dintre traducere și interpretare La traducere, programul sursă în limba sursă nu este executat imediat În primul rând, este convertit într-un program echivalent, așa-numitul obiect sau program binar executabil, care este executat numai după finalizarea traducerii Adică, atunci când traduceți, trebuie să parcurgeți doi pași: Crearea unui program echivalent în limba țintă Executarea programului primit Acești doi pași nu se efectuează în același timp Al doilea pas începe abia după finalizarea primului Există un singur pas în interpretare: execuția programului original Nu trebuie generat niciun program echivalent, deși uneori programul sursă este convertit într-o formă intermediară (de exemplu, cod Java) pentru a simplifica interpretarea În timpul execuției unui program obiect sunt implicate doar trei niveluri: microarhitectura, arhitectura de instrucțiuni și sistemul de operare Prin urmare, În literatura internă, se obișnuiește să se numească atât interpretarea, cât și traducerea compilației (autorul numește aici traducerea compilație) Cu alte cuvinte, traducătorii pot fi fie compilatori, fie interpreți - Notă științific ed Capitolul Nivel de asamblare în timp ce un program rulează, trei programe pot fi găsite în memoria computerului: programul obiect utilizator, sistemul de operare și firmware-ul (dacă există) Nu rămâne nicio urmă din programul original Adică, numărul de niveluri în timpul execuției programului poate să nu se potrivească cu numărul de niveluri înainte de traducere De remarcat că în această carte definim apartenența la un anumit nivel prin comenzile și constructele de limbaj disponibile programatorilor de acest nivel (și nu prin tehnologia de implementare), în timp ce unii autori fac distincție între niveluri implementate de interpreți și compilatori Introducere în asamblare Traducătorii pot fi împărțiți în două grupuri, în funcție de relația dintre limbile de intrare și de ieșire Dacă limbajul de intrare este o reprezentare simbolică a unui limbaj numeric de mașină, atunci traducătorul se numește asamblator, iar limbajul de intrare se numește limbaj de asamblare sau pur și simplu asamblator Dacă limbajul de intrare este un limbaj de nivel înalt (cum ar fi Java sau C) și limbajul de ieșire este fie un limbaj numeric de mașină, fie o reprezentare simbolică a acestuia din urmă, atunci traducătorul este numit compilator Conceptul de asamblator Limbajul de asamblare este un limbaj în care fiecare instrucțiune corespunde exact unei instrucțiuni de mașină Cu alte cuvinte, într-un program scris în asamblator, există o corespondență unu-la-unu între instrucțiunile mașinii și operatori Dacă fiecare linie dintr-un program de asamblare conține exact o declarație și fiecare cuvânt de mașină conține exact o instrucțiune, atunci un program de asamblare de n linii va produce un program de limbaj de mașină cu n cuvinte Programăm în limbaj de asamblare, nu în limbaj mașină (în hexazecimal), pentru că este mult mai ușor Este mult mai convenabil să folosiți nume și adrese simbolice în loc de cele binare și octale Mulți oameni își pot aminti că simbolurile pentru adunare (adunare), scădere (scădere), înmulțire (înmulțire) și împărțire (împărțire) sunt comenzile ADD, SUB, MUL și DIV, dar puțini își vor aminti valorile numerice corespunzătoare care sunt folosite pentru aceste comenzi car Un programator în limbaj de asamblare trebuie să cunoască doar numele simbolice, deoarece asamblatorul le traduce în instrucțiuni de mașină Această declarație se aplică și adreselor Un programator de limbaj de asamblare poate da nume simbolice locațiilor de memorie și este la latitudinea asamblatorului să se ocupe de obținerea valorilor numerice corecte din ele În același timp, un programator care scrie în limbajul mașinii trebuie întotdeauna să lucreze cu valori numerice ale adresei Acum nu mai există programatori care scriu programe în limbaj mașină, deși cu câteva decenii în urmă, înainte de inventarea asamblatorilor, programele erau scrise așa Introducere în asamblare Limbajul de asamblare are mai multe caracteristici care îl deosebesc de limbajele de nivel înalt În primul rând, aceasta este o corespondență unu-la-unu între instrucțiunile limbajului de asamblare și instrucțiunile mașinii (am vorbit deja despre asta) În al doilea rând, programatorul care scrie în assembler are acces la toate obiectele și comenzile mașinii țintă Programatorii care scriu în limbaje de nivel înalt nu au acest acces De exemplu, dacă mașina țintă conține un bit de overflow, un program de asamblare îl poate verifica, dar un npo-gram Java nu Un program de limbaj de asamblare poate executa orice instrucțiune din setul de instrucțiuni al mașinii țintă, dar un program de limbaj de nivel înalt nu poate Pe scurt, tot ceea ce se poate face în limbajul mașină poate fi făcut în asamblator, dar, în același timp, multe comenzi, registre și alte obiecte nu sunt disponibile programatorilor care scriu programe în limbaje de nivel înalt Limbajele de programare a sistemelor (cum ar fi C) se află adesea undeva la mijloc Ei, deși au o sintaxă inerentă limbajelor de nivel înalt, sunt mai aproape de asamblare în ceea ce privește accesibilitatea În cele din urmă, un program de asamblare poate rula doar pe computere din aceeași familie, în timp ce un program scris într-un limbaj de nivel înalt poate rula pe mașini diferite Capacitatea de a transfera software de la o mașină la alta este foarte importantă pentru multe aplicații Scopul asamblatorului Nu este ușor de lucrat cu limbajul de asamblare Scrierea aceluiași program în assembler durează mult mai mult timp decât într-un limbaj de nivel înalt În plus, depanarea durează foarte mult timp Dar de ce atunci scrieți programe în asamblare? Există două motive: performanță și acces la hardware În primul rând, un programator asamblator calificat poate scrie un program mult mai mic și mult mai rapid decât unul scris într-un limbaj de nivel înalt Pentru unele programe, viteza și volumul sunt extrem de importante Această categorie include multe aplicații încorporate (de exemplu, carduri inteligente, telefoane mobile, drivere de dispozitiv) și rutine BIOS Următorul motiv este că unele proceduri necesită acces complet la hardware, ceea ce de obicei nu este posibil cu limbaje de nivel înalt În această categorie se încadrează gestionatorii de întreruperi și excepții ale sistemului de operare, precum și controlerele de dispozitiv pentru sistemele încorporate în timp real Primul motiv (atingerea unor performanțe ridicate) este mai important, așa că îl vom analiza mai detaliat În majoritatea programelor, doar un mic procent din tot codul contribuie la timpul de execuție a programului De obicei, % din cod este responsabil pentru % din timpul de execuție, iar % din cod este responsabil pentru % din timpul de execuție Să presupunem că este nevoie de ani-om pentru a scrie un program într-un limbaj de nivel înalt, iar programul rezultat durează de secunde pentru a se executa Capitolul Nivel de asamblare un program tipic de control (Un program de referință este un program de testare care este folosit pentru a compara computere, compilatoare și așa mai departe ) Scrierea unui program întreg în assembler poate dura de ani-om Programul de control rezultat va rula în aproximativ de secunde, deoarece un programator bun poate fi de până la trei ori mai inteligent decât un compilator (deși acest lucru poate fi argumentat la nesfârșit) Tabelul ilustrează situația Tabelul Comparație de programare în limbaj de asamblare și limbaj de nivel înalt Timp de programare, ani om Timp de executare a programului, s Limbajul de asamblare Limbă la nivel înalt Abordare mixtă a ajustării Critic % Restul de % Total Abordare mixtă după ajustare Critic % Restul de % Total Deoarece doar o mică parte a programului este responsabilă pentru cea mai mare parte a timpului de execuție al programului, este posibilă o altă abordare În primul rând, programul este scris într-un limbaj de nivel înalt Apoi sunt efectuate o serie de măsurători pentru a determina care părți ale programului contribuie cel mai mult la timpul de execuție Pentru astfel de măsurători, se folosește de obicei ceasul de sistem Cu acesta, puteți afla cât durează fiecare procedură, de câte ori este efectuat fiecare ciclu etc Să presupunem că % din program este responsabil pentru % din timpul său de execuție Aceasta înseamnă că din de secunde de lucru, de secunde reprezintă a zecea parte a programului, iar secunde - restul de % Aceste % din program pot fi îmbunătățite prin rescriere în assembler Acest proces se numește tuning Va dura încă ani-om pentru a ajusta procedurile de bază, dar timpul de execuție a programului va fi redus de la la de secunde Să comparăm această abordare mixtă, folosind atât limbajul de asamblare, cât și limbajul de nivel înalt, cu abordarea care utilizează numai limbajul de asamblare (vezi Tabelul ) Cu a doua abordare, programul rulează cu aproximativ % mai rapid ( față de de secunde), dar cu mai mult de trei costuri ( față de ani-om) Mai mult decât atât, abordarea mixtă are un alt avantaj: este mult mai ușor să rescrieți o procedură deja depanată scrisă într-un limbaj de nivel înalt în assembler decât să scrieți această procedură în assembler de la zero Rețineți că, dacă scrierea unui program a durat exact an, raportul dintre Introducere în asamblare o abordare mixtă și o abordare numai de adunare ar fi : în favoarea abordării mixte În același timp, un programator care scrie într-un limbaj de nivel înalt nu trebuie să se gândească la mutarea biților individuali, astfel încât să se gândească la problema în ansamblu și, uneori, reușește să construiască un program în așa fel încât să realizează o creștere reală a performanței Această situație nu este de obicei tipică pentru programatorii de asamblare - de regulă, aceștia se luptă cu instrucțiuni individuale, încercând să salveze câteva cicluri Oricum ar fi, există cel puțin motive bune pentru a învăța limbajul de asamblare În primul rând, este de dorit să se poată scrie programe în asamblator, deoarece succesul sau eșecul unui proiect mare depinde uneori de dacă va fi sau nu posibilă sau nu creșterea de mai multe ori a vitezei unei singure, dar importante proceduri În al doilea rând, accesarea asamblatorului poate fi singura cale de ieșire posibilă în caz de deficit de memorie Cardurile inteligente, de exemplu, conțin o unitate centrală de procesare, dar puține dintre ele au chiar și un megaoctet de memorie și foarte puține au un hard disk pentru paginare Cu toate acestea, cu resurse atât de limitate, trebuie să efectueze calcule complexe Procesoarele încorporate în aparatele electrice au adesea o cantitate minimă de memorie, deoarece trebuie să fie rezonabil de ieftine O cantitate la fel de mică de memorie este de obicei furnizată cu diferite dispozitive electronice alimentate cu baterii, deoarece au nevoie de un cod compact, dar eficient În al treilea rând, compilatorul trebuie fie să producă un program la ieșire care poate fi utilizat de către asamblator, fie să execute independent asamblarea Astfel, cunoașterea limbajului de asamblare este esențială pentru înțelegerea modului în care funcționează un computer Și, în general, cineva trebuie să scrie compilatorul (și asamblatorul acestuia) În cele din urmă, asamblatorul oferă o idee grozavă despre mașina reală Pentru cei care studiază arhitectura computerelor, scrierea codului de asamblare este singura modalitate de a afla ce este o mașină Format operator în asamblator Deși structura unei instrucțiuni de asamblare reflectă structura instrucțiunii de mașină corespunzătoare, limbajele de asamblare pentru diferite mașini și niveluri diferite sunt similare în multe feluri, ceea ce face posibil să vorbim despre limbajul de asamblare în ansamblu Listările - arată fragmente de cod în asamblatoarele Pentium , Motorola x și (Ultra)SPARC Toate aceste programe evaluează formula N = I + J În toate cele trei exemple, instrucțiunile de deasupra șirului gol efectuează calculul, iar instrucțiunile de sub șirurile goale rezervă memorie pentru variabilele I, J și N Adică, ultimele afirmații nu sunt reprezentări simbolice ale instrucțiunilor mașinii Pentru computerele din familia Intel, există mai mulți asamblatori care diferă unul de celălalt ca sintaxă În această carte, vom folosi limbajul de asamblare Microsoft MASM Și deși vom vorbi despre procesor Capitolul Nivel de asamblare Pentium , toate cele de mai sus se aplică procesoarelor , , Pentium și Pentium Pro Pentru procesorul SPARC, vom folosi asamblatorul Sun și tot acest lucru se aplică și versiunilor anterioare pe de biți În cartea codurilor operațiunile și registrele sunt întotdeauna indicate cu majuscule, iar nu doar pentru asamblator Pentium , ca de obicei, dar si pentru asamblator Sun, unde prin convenție literele sunt mici Lista Calcularea expresiei N = I + j în asamblatorul Pentium FORMULA: my EAX I înregistrez EAX = I Adăugați registrul EAX,J EAX = I + J MOV N EAX N=I+J DD rezerv octeți și îi inițializez la J DD rezervă octeți și inițializați-i la N DD rezervă octeți și inițializați-i la Lista Calculul expresiei N = I + j în asamblatorul Motorola x FORMULA MOVE L I DO registru DO = I ADD L J DO registrul DO = I + J MUȚI L DO NN = I + j I DC L : rezervă octeți : și inițializați-i la J DC L : rezervă octeți : și inițializați-i la N DC L ; rezervare octeți; iar inițializarea lor la Lista Evaluarea expresiei N = I + J în asamblatorul SPARC FORMULA: SETHI W(I) JRl ! R = MSB-uri de adresa I LD! R = I SETHI ^HI(J) JR ! R = biți înalți ai adresei J LD L£R +£L (J)LW ! R =J NOP! în aşteptarea lui J din memorie ADAUGĂ £R JR ,£R ! R = Rl + R SETHI ^HI(N) JRl ! R = MSB-uri ale adresei N ST Ш, [Ш+ШХУ] I: CUVINTUL ! rezervare octeți! iar initializarea lor cu valoarea J: CUVINTUL ! rezervare octeți! și inițializarea valorii lor - N: CUVANT ! rezervare octeți! și inițializarea valorii lor Declarațiile de asamblare constau din patru câmpuri: etichete, operații, operanzi și comentarii Etichetele servesc ca nume simbolice pentru adresele de memorie Acestea vă permit să săriți la comenzi și date, permițându-vă să accesați locul în care comenzile și datele sunt stocate printr-un nume simbolic Dacă o declarație este etichetată, eticheta este de obicei plasată la începutul liniei Fiecare dintre cele trei exemple are etichete: FORMULA, I, J și N Rețineți că asamblatorul SPARC necesită două puncte după fiecare etichetă, în timp ce asamblatorul Motorola nu În asamblatorul computerelor Intel, se pune doar două puncte Introducere în asamblare după etichetele de comandă, dar nu după etichetele de date Această diferență nu este deloc fundamentală, ci doar că dezvoltatorii diferiților asamblatori au gusturi diferite Arhitectura mașinii nu influențează în niciun fel cutare sau cutare alegere Singurul avantaj al două puncte este că puteți scrie eticheta pe o linie separată și opcode-ul pe următoarea linie, indentată în același mod ca eticheta Fără două puncte, ar fi imposibil pentru compilator să distingă eticheta de codul operațional atunci când este plasat pe linii separate La unele asamblatoare, lungimea etichetei este limitată la sau caractere În același timp, în majoritatea limbilor de nivel înalt, lungimea numelor este arbitrară Numele lungi și bine alese fac programul mai ușor de citit și de înțeles Fiecare mașină are mai multe registre, dar au nume complet diferite Registrele Pentium se numesc EAX, EBX, ECX etc , registrele Motorola sunt DO, Dl, D , registrele SPARC au mai multe denumiri În această carte, vom folosi simbolurile Ш și #R pentru a le reprezenta Câmpul opcode conține fie abrevierea simbolică a acestui cod (dacă operatorul este o reprezentare simbolică a unei instrucțiuni de mașină), fie instrucțiunea asamblatorului însuși Alegerea numelui este o chestiune de gust și, prin urmare, diferiți dezvoltatori le numesc diferit Proiectanții de asamblare Intel au ales să folosească denumirea MOV atât pentru încărcarea unui registru din memorie, cât și pentru salvarea unui registru în memorie, designerii de asamblare Motorola au ales denumirea MOVE pentru ambele operațiuni, iar designerii de asamblare SPARC au decis să folosească simbolurile LD pentru prima operație și ST pentru al doilea Evident, alegerea numelor în acest caz nu are nimic de-a face cu arhitectura mașinii Dimpotrivă, necesitatea de a specifica două instrucțiuni de mașină pentru accesul la memorie este explicată de arhitectura SPARC, deoarece adresele virtuale pot fi pe de biți (ca în SPARC versiunea ) și pe de biți (ca în SPARC versiunea ) și instrucțiuni poate conține maximum de biți de date Prin urmare, sunt întotdeauna necesare două comenzi pentru a transmite toți biții ai adresei virtuale complete De exemplu: SETHI YANI(I)DK Această instrucțiune setează cei de biți înalți și cei biți inferiori ai registrului de de biți R la zero și apoi plasează cei de biți înalți ai adresei de de biți a variabilei I în pozițiile de biți de la la ale registrului R Mai departe: eo[w+shhsh Această instrucțiune adaugă R și cei biți inferiori ai adresei I (rezultând adresa completă a lui I), apelează cuvântul dat din memorie și îl plasează în registrul R Aceste comenzi, sincer, nu sunt foarte elegante, dar dezvoltatorii SPARC nu au urmărit frumusețea Li s-a dat sarcina de a asigura o viteză mare de execuție și au rezolvat-o cu succes Procesoarele din familia Pentium, x și SPARC vă permit să lucrați cu operanzi de diferite lungimi (dimensiune octet, cuvânt și cuvânt lung) Cum determină asamblatorul lungimea operanzilor? Și din nou, dezvoltatorii diferiților asamblatori au luat decizii diferite În Pentium , registrele de lungimi diferite au nume diferite De exemplu, pentru a muta valori pe de biți, utilizați Capitolul Nivel de asamblare se numește EAX, pentru biți - AX, iar pentru biți - AL și AN Designerii de asamblare Motorola au decis să sufix fiecare cod operațional cu L pentru lung, W pentru cuvânt și B pentru octet SPARC folosește coduri operaționale diferite pentru operanzi de lungimi diferite, de exemplu, pentru a încărca un octet, o jumătate de cuvânt și un cuvânt într-un registru de de biți, codurile operaționale sunt LDSB, LDSH și, respectiv, LDSW După cum puteți vedea, natura limbilor este complet arbitrară Cei trei asamblatori pe care îi analizăm diferă în modul în care alocă spațiu pentru date Designerii de asamblare Intel au ales numele DD (Define Double) pentru această operație deoarece cuvântul procesorului avea o lungime de biți Motorola folosește abrevierea DC (Define Constant) Dezvoltatorii SPARC au preferat de la început numele WORD Din nou, diferențele sunt complet aleatorii Câmpul operanzi al operatorului specifică adresele și registrele care sunt operanzii instrucțiunii mașinii În domeniul operanzilor instrucțiunii de adăugare a întregului, se indică ce trebuie adăugat și la ce Câmpul operand instrucțiunii de salt determină locul în care se face saltul Operanzii pot fi registre, constante, locații de memorie etc Câmpul de comentarii explică acțiunile programului Aceste explicații pot fi utile programatorilor care trebuie apoi să utilizeze și să modifice programul altcuiva, precum și autorului însuși al programului când revine să lucreze la el un an mai târziu Un program de asamblare fără astfel de comentarii este ceva complet de neinteligibil (chiar și pentru autorul său) Comentariile pot fi utile doar oamenilor și nu afectează în niciun fel funcționarea programului directive Programul de asamblare definește nu numai instrucțiunile mașinii pe care procesorul trebuie să le execute, ci și instrucțiunile pe care asamblatorul însuși trebuie să le execute (de exemplu, alocă o anumită memorie sau emite o nouă pagină de listare) Comenzile de asamblare sunt numite pseudo-comenzi sau directive de asamblare În Listarea , am văzut deja o pseudo-comandă tipică DD În tabel listează alte pseudo-comenzi (directive) Acestea sunt preluate din asamblatorul MASM din familia de asamblare Intel Tabelul Unele directive de asamblare MASM Descrierea directivei SEGMENT Începutul unui nou segment (text, date etc ) cu atribute definite ENDS Încheiați segmentul curent ALIGN Controlează alinierea următoarei comenzi sau date EQU Definiți un nou caracter egal cu expresia dată Alocarea memoriei DB pentru unul sau mai mulți octeți DW Alocarea memoriei pentru unul sau mai multe jumătăți de cuvinte de biți DD Alocarea memoriei pentru unul sau mai multe cuvinte de de biți Introducere în asamblare Descrierea directivei DQ Alocarea memoriei pentru unul sau mai multe cuvinte duble pe de biți PROC Porniți procedura ENDP Încheiați procedura MACRO Pornire macro ENDM End macro PUBLIC Exportați numele definit în acest modul EXTERN Importați numele dintr-un alt modul INCLUDE Apelați un alt fișier și includeți-l în fișierul curent IF Începe asamblarea condiționată a programului pe baza expresiei date ELSE Porniți asamblarea condiționată a programului dacă nu este îndeplinită condiția pentru directiva IF ENDIF Încheiați asamblarea programului condiționat COMMENT Specificarea unui nou caracter de început pentru câmpul de comentariu PAGE Forțați o întrerupere de pagină într-o listă Sfârșit Încheiați programul de asamblare Directiva SEGMENT începe un nou segment, iar directiva ENDS îl încheie Este permis să porniți un segment de text, apoi să începeți un segment de date, apoi să săriți înapoi la un segment de text și așa mai departe Directiva ALIGN transmite următorul șir (de obicei date) la adresa dată de argumentul directivei De exemplu, dacă segmentul curent conține deja de octeți de date, atunci după ce directiva ALIGN este executată, următoarea adresă alocată va fi adresa Directiva EQII dă un nume simbolic unei expresii De exemplu, după următoarea directivă, caracterul BASE poate fi folosit în program în loc de valoarea : VAZA EQU Expresia care urmează directivei EQU poate conține mai multe caractere unite prin aritmetici și alți operatori, de exemplu: LIMIT EQU * VAZE + Majoritatea asamblatorilor, inclusiv MASM, necesită ca un simbol să fie definit în program înainte de a apărea într-o expresie ca aceasta Directivele DB, DD, DW și DQ alocă memorie pentru una sau mai multe variabile de , , și, respectiv, octeți De exemplu: TABEL DB I Această directivă alocă spațiu pentru octeți și le setează la valorile inițiale AND, și respectiv și, de asemenea, definește un caracter TABLE egal cu adresa unde este stocată valoarea AND Capitolul Nivel de asamblare Directivele PROC și ENDP definesc începutul și sfârșitul rutinelor de asamblare Procedurile din asamblare îndeplinesc același rol ca și în limbajele de programare de nivel înalt Directivele MACRO și ENDM definesc începutul și sfârșitul unei macrocomenzi Vom vorbi despre macrocomenzi în secțiunea următoare Directivele PUBLIC și EXTERN determină vizibilitatea (accesibilitatea) simbolurilor Programele sunt adesea scrise ca o colecție de fișiere Uneori, o procedură dintr-un fișier trebuie să apeleze o procedură sau să acceseze date definite într-un alt fișier Pentru a face posibile astfel de referințe încrucișate între fișiere, caracterul (numele) care urmează să fie pus la dispoziția altor fișiere este exportat utilizând directiva PUBLIC Pentru ca asamblatorul să nu emită avertismente despre utilizarea unui simbol care nu este definit în acest fișier, acest simbol poate fi declarat extern (EXTERN), adică definit într-un alt fișier Simbolurile care nu sunt definite în niciuna dintre aceste directive pot fi utilizate numai în cadrul aceluiași fișier Prin urmare, chiar dacă, de exemplu, simbolul F apare în mai multe fișiere, acest lucru nu va provoca niciun conflict, deoarece simbolul specificat este local pentru fiecare fișier Directiva INCLUDE determină asamblatorul să apeleze un alt fișier și să îl includă în cel curent Aceste fișiere incluse conțin adesea definiții, macrocomenzi și alte elemente necesare diferitelor fișiere Multe limbaje de asamblare, inclusiv MASM, acceptă asamblarea condiționată a programelor De exemplu: WORDSIZE EQU IF WORDSIZE GT WSIZE: DW ELSE DIMENSIUNEA W: DW ENDIF Acest program alocă un cuvânt de de biți în memorie și își apelează adresa WSIZE Acest cuvânt primește una dintre valorile: fie , fie , în funcție de valoarea WORDSIZE (în acest caz, ) Această construcție poate fi utilizată în programe pentru mașini pe biți (cum ar fi ) sau pe de biți (cum ar fi Pentium ) Dacă introduceți directivele IF și ENDIF la începutul și la sfârșitul codului specific mașinii și apoi modificați definiția unică, WORDSIZE, programul poate fi ajustat automat la una dintre cele două dimensiuni Folosind această abordare, puteți utiliza un astfel de program sursă pentru mai multe mașini diferite În cele mai multe cazuri, toate definițiile specifice mașinii, cum ar fi WORDSIZE, sunt stocate într-un singur fișier și ar trebui să existe fișiere diferite pentru diferite mașini Prin includerea unui fișier cu definițiile necesare, programul poate fi ușor recompilat pentru diferite mașini Directiva COMMENT permite utilizatorului să înlocuiască caracterul de început al comentariului (punct și virgulă) cu altceva Directiva PAGE este folosită pentru a controla listarea unui program În cele din urmă, directiva END marchează sfârșitul programului Există multe mai multe directive în asamblatorul MASM Alți asamblatori Pentium conțin un set diferit de directive, deoarece aceste directive sunt determinate nu de arhitectura mașinii, ci de gusturile dezvoltatorilor de asamblare Macro-uri Macro-uri De obicei, programatorii care scriu în limbaj de asamblare trebuie să repete aceleași lanțuri de comandă iar și iar Deși este cel mai ușor să scrieți comenzile potrivite ori de câte ori sunt necesare, devine plictisitor, mai ales dacă secvența este suficient de lungă sau dacă trebuie repetată prea des O abordare alternativă este de a încheia această secvență într-o procedură și de a o apela atunci când este necesar Această strategie are și dezavantajele ei, deoarece în acest caz va trebui să executați o instrucțiune de apel de procedură specială și o instrucțiune de returnare de fiecare dată Dacă secvențele de instrucțiuni sunt scurte (de exemplu, doar două instrucțiuni), dar sunt utilizate frecvent, atunci apelurile de procedură pot afecta semnificativ performanța programului Macro-urile sunt o soluție simplă și eficientă la această problemă Definiție macro, apel macro și extinderea macro O macrocomandă este o modalitate de a da un nume unei bucăți de cod După ce macro-ul este definit, programatorul poate scrie numele macro-ului în loc de un fragment de cod În esență, o macrocomandă este doar numele unei bucăți de cod Lista - arată un program de asamblare Pentium care schimbă de două ori valorile variabilelor P și Q Iată cum arată lanțul principal de instrucțiuni: MOV EAX P MOV EBX Q MOV Q EAX MOV P EBX Lista definește această secvență ca macrocomandă SWAP Lista Modificarea valorilor variabilelor P și Q fără a utiliza o macrocomandă MOV EAX P MOV EBX Q MOV Q EAX MOV P EBX MOV EAX P MOV EBX Q MOV Q EAX MO V P EBX Lista Modificarea valorilor variabilelor P și Q folosind o macrocomandă SWAP MACRO MOV EAX R MOV EBX Q MOV Q EAX MOV P EBX ENDM SWAP SWAP Capitolul Nivel de asamblare Deși definiția unei macrocomenzi arată ușor diferită în diferite limbaje de asamblare, în total ea constă din aceleași părți de bază: ♦ antet macro, care dă denumirea macro-ului care se definește; ♦ text care conține corpul macro-ului; ♦ O directivă care completează definiția (ex ENDM) Când asamblatorul întâlnește o definiție de macro într-un program, o stochează în tabelul de definiții de macro pentru o utilizare ulterioară Ori de câte ori o macrocomandă (în exemplul nostru, SWAP) apare ca un cod operațional în program, asamblatorul o va înlocui cu corpul macrocomenzii Utilizarea unui nume de macrocomandă ca opcode se numește apel de macrocomandă, iar înlocuirea acestuia cu un corp de macrocomandă se numește extindere macro Extinderea macro-ului are loc în timpul asamblarii, nu în timpul execuției programului Acest moment este foarte important Programele din listele - și - generează același cod de mașină Este imposibil să se determine dintr-un program în limbaj de mașină dacă au fost utilizate macrocomenzi atunci când a fost generat sau nu Nu există semne de macrocomenzi în programul rezultat Apelurile macro nu trebuie confundate cu apelurile de procedură Principala diferență este că un apel macro este o comandă către asamblator pentru a înlocui numele macrocomenzii cu corpul macrocomenzii Un apel de procedură este o instrucțiune de mașină care, odată introdusă într-un program obiect, trebuie executată ulterior pentru a apela procedura În tabel compară apelurile macro și apelurile de procedură Tabelul Compararea apelurilor macro și a apelurilor de procedură Apel macro Apel de procedură Când se face apelul? În timpul asamblarii În timpul executării programului Corpul macrocomenzii sau procedurii este inserat în programul obiect de fiecare dată când se efectuează apelul? Nu chiar Este o instrucțiune de apel de procedură inserată într-un program obiect, care este apoi executat? Nu da Trebuie să folosesc comanda return după apel? Nu da Câte copii ale corpului unui apel macro sau proceduri apar într-un program obiect? Unul pentru apel macro Unul Putem considera că procesul de asamblare are loc în două treceri La prima trecere, toate definițiile macro sunt păstrate și apelurile macro sunt extinse La a doua trecere, textul rezultat este procesat Cu alte cuvinte, programul original este citit și apoi transformat într-un alt program din care sunt eliminate toate definițiile macro și în care fiecare apel de macro este înlocuit cu un corp de macro Programul rezultat fără macro-uri este apoi introdus în asamblator Macro-uri Este important să rețineți că un program este un șir de caractere, care pot fi litere, numere, spații, semne de punctuație și întoarceri de căruță (întreruperi de linie) Extinderea macro-ului înlocuiește anumite subșiruri din acest șir cu alte șiruri de caractere Macro-urile sunt un mijloc de manipulare a șirurilor de caractere fără a le schimba sensul Macro-uri cu parametri Macro-urile descrise în subsecțiunea anterioară pot fi folosite pentru a reduce volumul programelor care repetă adesea aceeași secvență de comenzi Cu toate acestea, uneori un program conține mai multe secvențe de comenzi similare, dar nu identice De exemplu, în Lista - , prima secvență schimbă valorile P și Q, iar a doua schimbă R și S Lista Modificarea valorilor a două perechi de variabile fără a utiliza macro-ul MOV EAX P MOV EBX Q MOV Q EAX MOV P EBX MOV EAX R MOV EBX S MOV S EAX MOV R EBX Pentru a face față unor astfel de secvențe aproape identice, sunt furnizate definiții macro care oferă parametri formali și apeluri macro, în care parametrii formali sunt înlocuiți cu parametri reali Parametrii actuali sunt plasați în câmpul operand al apelului macro Lista Programul prezentat în Listarea include o macrocomandă cu doi parametri Simbolurile P și P sunt parametri formali În timpul extinderii macro, fiecare caracter P din corpul macro-ului este înlocuit cu primul parametru real, iar caracterul P cu al doilea parametru real Exemplu: SCHIMBA PQ În acest apel macro, P este primul parametru real și Q este al doilea parametru real Astfel, programele din listele și sunt identice Lista Modificarea valorilor a două perechi de variabile folosind macro-ul CHANGE MACRO P P MOV EAX PI MOV EBX P MOV P EAX MOV Pl EBX ENDM SCHIMBA PQ SCHIMBA RS Capitolul Nivel de asamblare Caracteristici suplimentare Majoritatea procesoarelor macro acceptă o serie de caracteristici suplimentare care facilitează munca unui programator în limbaj de asamblare În această subsecțiune, ne vom uita la câteva funcții suplimentare ale asamblatorului MASM Toți asamblatorii au o problemă: duplicarea etichetelor Să presupunem că macro-ul conține o instrucțiune de ramificare condiționată și o etichetă la care sări Dacă macro-ul este apelat de două sau de mai multe ori, eticheta va fi duplicată, ceea ce va provoca o eroare Prin urmare, programatorul trebuie să atribuie o etichetă fiecărui apel ca parametru O altă soluție (folosită în MASM) este declararea etichetei locale (LOCAL), caz în care asamblatorul va genera automat o etichetă diferită de fiecare dată când macro-ul este extins În unele asamblatoare, etichetele numerice sunt considerate locale în mod implicit MASM și majoritatea celorlalți asamblatori permit definirea macrocomenzilor în cadrul altor macrocomenzi Această caracteristică este foarte utilă în combinație cu asamblarea programelor condiționate De obicei, aceeași macrocomandă este definită în ambele ramurile lor ale declaraţiei IF: Ml MACRO M IF WORDSIZE GT MACRO M ENDM ELSE MACRO ENDM ENDIF ENDM În ambele cazuri, macro-ul M va fi definit, dar definiția depinde dacă programul este asamblat pe o mașină de biți sau de biți Dacă M nu este apelat, macro M nu va fi definită deloc Unele macrocomenzi pot apela alte macrocomenzi, inclusiv ele însele Dacă macro-ul este recursiv, adică se autoinvocă, trebuie să-și transmită un parametru (care se schimbă cu fiecare extindere), apoi verifică acel parametru și încheia recursiunea când parametrul atinge o anumită valoare În caz contrar, va rezulta o buclă infinită, iar apoi utilizatorul va trebui să finalizeze asamblarea manual Implementarea macro-urilor în asamblator Pentru a implementa macrocomenzi, asamblatorul trebuie să poată îndeplini două funcții: să păstreze definițiile macro și să extindă apelurile macro Ne vom uita pe rând la aceste funcții Asamblatorul trebuie să mențină un tabel cu toate numele macrocomenzilor, în care fiecare nume este urmat de un indicator către definiția acelei macrocomenzi, astfel încât să poată fi preluat dacă este necesar Unii asamblatori oferă un tabel separat pentru numele macrocomenzilor, în timp ce alții conțin un tabel comun în care proces de asamblare Torusul conține nu numai numele macro, ci și toate comenzile și directivele mașinii Când se întâlnește o definiție de macrocomandă, este creată o nouă intrare de tabel cu numele macrocomenzii, numărul de parametri și un pointer către un alt tabel care va stoca corpul macrocomenzii În acest moment, este creată și o listă de parametri formali Corpul macrocomenzii este apoi citit și stocat în tabelul de definire a macrocomenzii Parametrii formali care apar în corpul buclei sunt indicați printr-un simbol special Mai jos este un exemplu de reprezentare internă a macrocomenzii CHANGE Caracterul de întoarcere caruș este un punct și virgulă, iar caracterul parametru formal este un ampersand MOV EAX,&P ;MOV EBX &P :MOV &P EAX;MOV &P EBX: În tabelul de definire a macrocomenzii, corpul unei macrocomenzi este pur și simplu un șir de caractere La asamblare, în timpul primei treceri, se găsesc opcodes și macrocomenzi sunt extinse Ori de câte ori este întâlnită o definiție macro, aceasta este stocată în tabelul macro Când este apelată o macrocomandă, asamblatorul întrerupe temporar citirea datelor de intrare de pe dispozitivul de intrare și începe să citească corpul stocat al macrocomenzii Parametrii formali extrași din corpul macro-ului sunt înlocuiți cu parametrii actuali care sunt furnizați atunci când sunt apelați Un ampersand în fața parametrilor permite asamblatorului să-i recunoască proces de asamblare Următoarele subsecțiuni arată cum funcționează asamblatorul Și deși asamblatorii diferitelor mașini sunt diferiți, procesul de asamblare este în esență același Asamblare în două treceri Deoarece un program de asamblare constă dintr-o serie de instrucțiuni, la prima vedere poate părea că asamblatorul trebuie să citească mai întâi declarația, apoi să o traducă în limbajul mașinii și, în final, să transfere limbajul mașinii rezultat într-un fișier, iar fragmentul de listare corespunzător în alt dosar Acest proces trebuie repetat până când întregul program a fost tradus Din păcate, însă, această strategie nu funcționează Luați în considerare o situație în care prima instrucțiune este un salt la adresa L Asamblatorul nu poate asambla instrucțiunea până când nu cunoaște adresa L Dar adresa L poate fi undeva la sfârșitul programului și atunci asamblatorul nu poate găsi această adresă fără citind întregul program Această problemă se numește problema referinței înainte și constă în faptul că caracterul L este folosit înainte de a fi definit (adică este accesat caracterul, a cărui definiție va apărea ulterior) Legăturile directe pot fi gestionate în două moduri În primul rând, asamblatorul poate citi programul de două ori Fiecare citire a programului sursă se numește trecere și un traducător care citește programul sursă de două ori Capitolul Nivel de asamblare numită cu două sensuri La prima trecere, toate definițiile simbolurilor, inclusiv etichetele, sunt colectate și stocate într-un tabel În momentul în care începe cea de-a doua trecere, valorile simbolului sunt deja cunoscute, astfel încât nu apare nicio referință înainte și fiecare declarație poate fi citită și asamblată Deși acest lucru necesită o trecere suplimentară prin programul original, această strategie este relativ simplă În a doua abordare, programul de asamblare este citit o dată și convertit într-o formă intermediară, iar această formă intermediară este stocată într-un tabel Apoi face a doua trecere, dar nu conform programului original, ci conform tabelului Dacă există suficientă memorie fizică (sau virtuală) pentru această abordare, timpul petrecut în procesul I/O este salvat Dacă o listă trebuie să apară în timpul asamblarii, atunci declarațiile originale, inclusiv comentariile, sunt complet păstrate Dacă listarea nu este necesară, atunci forma intermediară poate fi scurtată, lăsând doar cele mai esențiale Un alt obiectiv al primei treceri este de a păstra toate macrocomenzile și de a extinde apelurile pe măsură ce apar Prin urmare, atât definirea caracterului, cât și extinderea macro au loc în aceeași trecere Prima trecere Scopul principal al primei treceri este de a construi un tabel de simboluri care să conțină valorile tuturor simbolurilor Un simbol poate fi fie o etichetă, fie o valoare căreia i se atribuie un nume simbolic specific prin intermediul unei directive: BUFSIZE EQU Atribuind o valoare unui nume simbolic în câmpul de etichetă al unei instrucțiuni, asamblatorul trebuie să știe ce adresă va avea acea instrucțiune în timpul rulării Pentru a face acest lucru, asamblatorul salvează o variabilă specială în timpul asamblarii numită Instruction Location Counter (ILC) La începutul primei treceri, această variabilă este setată la și este incrementată după fiecare comandă procesată de lungimea acelei comenzi Lista arată exemplul Pentium corespunzător (penultima coloană a câmpului de comentariu arată lungimea fiecărei instrucțiuni, iar ultima coloană arată valoarea contorului acumulată) În acest exemplu, instrucțiunile până la eticheta MARI A ocupă de octeți Nu vom da exemple pentru SPARC și Motorola, deoarece diferențele dintre limbajele de asamblare nu sunt foarte importante și un exemplu este suficient În plus, după cum ați văzut deja, asamblatorul SPARC este complet ilizibil Lista - - Contorul de adrese de instrucțiuni ține evidența adreselor de instrucțiuni MARIA: MOV EAX, I EAX = I MOV EVH J EBX = J ROBERTA: MOV ECX, K ECX = K IMUL EAX EAX EAX \u d I * I IMUL EBX EBX EBX = J * J IMUL ECX, ECX ECX = K * K MARILYN: Adăugați EAX, EBX EAX = I * I + J * J Adăugați EAX, ECX EAX = I * I + J * J + K * K STEPHANY: JMP DONE trece la DONE proces de asamblare La prima trecere, majoritatea asamblatorilor folosesc cel puțin tabele: tabelul de simboluri, tabelul de directive și tabelul de coduri operaționale Dacă este necesar, se folosește și un tabel literal Tabelul cu nume simbolice conține o intrare pentru fiecare nume, așa cum se arată în Tabelul Numele simbolice sunt fie etichete, fie definite în mod explicit (de exemplu, folosind directiva EQU) Fiecare element al tabelului de nume simbolice conține numele în sine (sau un indicator către acesta), valoarea sa numerică și uneori câteva informații suplimentare Poate include: + lungimea câmpului de date asociat caracterului; + biți de realocare a memoriei (care indică dacă valoarea simbolului se va schimba dacă programul este încărcat la o altă adresă decât asamblatorul intenționat să-l încarce); + informații despre dacă simbolul poate fi accesat din afara procedurii Tabelul , Tabelul numelor simbolice ale programului din Lista Nume simbolic Semnificație Alte informații MARIA ROBERTA MARILYN STEFANIA Tabelul de coduri operaționale are cel puțin o intrare pentru fiecare cod operațional de asamblare simbolică (Tabelul ) Fiecare intrare conține un cod operațional de caractere, doi operanzi, valoarea numerică a codului operațional, lungimea instrucțiunii și un număr de tip care poate fi utilizat pentru a determina grupului căruia îi aparține codul operațional (codurile operaționale sunt împărțite în grupuri în funcție de număr și tip de operanzi) Tabelul - Mai multe elemente ale tabelului de coduri operaționale a asamblatorului Pentium Opcode Primul operand Al doilea operand Cod hexadecimal Lungime comandă Clasa de comandă AAA - - ADAUGĂ EAX immed ADĂUGAȚI regul SI EAX immed ȘI regul Ca exemplu, luați în considerare opcode-ul ADD Dacă primul operand al instrucțiunii ADD este registrul EAX, iar al doilea operand este o constantă de de biți (immed ), atunci se folosește codul operațional x , iar lungimea instrucțiunii este de octeți Dacă ambii operanzi ai unei instrucțiuni ADD sunt registre, instrucțiunea are octeți și codul operațional este x Toate combinațiile de opcode și operanzi care Capitolul Nivel de asamblare respectă această regulă, sunt clasa și sunt procesate în același mod ca instrucțiunea ADD cu două registre ca operanzi O clasă de comandă identifică o procedură care este apelată pentru a procesa toate comenzile de un anumit tip În unele asamblatoare, este posibil să scrieți instrucțiuni folosind adresarea directă, chiar dacă instrucțiunea corespunzătoare nu este în limba țintă Astfel de comenzi cu adrese "pseudo-imediate" sunt procesate după cum urmează Asamblatorul atribuie o zonă de memorie operandului imediat la sfârșitul programului și generează o instrucțiune care îl accesează De exemplu, mainframe-ul IBM nu are comenzi cu adrese directe Cu toate acestea, pentru a încărca constanta cu cuvânt complet în registrul , programatorul poate scrie comanda: L ,=F' ' Astfel, programatorul nu trebuie să scrie o directivă pentru a plasa un cuvânt în memorie, să-i dea valoarea , să-i dea o etichetă și apoi să folosească acea etichetă într-o instrucțiune L Constanțele pentru care asamblatorul le alocă automat memorie sunt numite literale Literale fac un program mai ușor de citit și de înțeles, făcând evident semnificația unei constante în enunțul original La prima trecere, asamblatorul trebuie să creeze un tabel cu toate literalele care sunt utilizate în program Toate cele trei computere pe care le-am luat drept exemple au instrucțiuni cu adrese imediate, astfel încât asamblorii lor nu acceptă literale Comenzile cu adrese imediate sunt acum considerate destul de comune, deși înainte erau considerate ceva complet exotic Poate că popularitatea literalilor i-a convins pe dezvoltatori că adresarea directă este o idee foarte bună Dacă sunt necesare literali, atunci în timpul asamblarii este stocat un tabel de literali în care apare un nou element de fiecare dată când este întâlnit un literal După prima trecere, tabelul este sortat și elementele duplicat sunt eliminate Lista arată mecanismul din spatele primei treceri de asamblare Numele comenzilor sunt alese în așa fel încât esența lor să fie clară Această listă este un bun punct de plecare pentru învățarea adunării Este destul de scurt, de înțeles și arată care ar trebui să fie următorul pas - aceasta este scrierea procedurilor care sunt menționate în această listă Lista Prima trecere a asamblatorului simplu public static void pass one() { // Această procedură este prima trecere a asamblatorului boolean morejnput=true; // steag care oprește prima trecere String line, simbol, literal, opcode; // câmpuri de comandă int locație counter, lungime, valoare, tip: // variabile final int END STATEMENT = - ; // sfârșitul semnalelor de intrare locație counter= ; // asamblarea primei comenzi din celula O initialize tables(); // inițializare generală // morejnput folosind directiva END // obține valoarea "false" în timp ce (mai multă intrare) { proces de asamblare line = read next line(): lungime = ; tip= ; // citește șirul // # octet în comandă // tipul comenzii if (linia nu este comentare(linia)) { simbol = verifica pentru simbol(linie); dacă (simbol != nul) // șirul conține o etichetă? // dacă da, atunci // caracterul și valoarea sunt scrise enter new symbol(simbol, locație counter); literal = check for literal( ine); // șirul conține un literal? if (literal != nulli) // dacă da, atunci it // stocat în tabel enter new literal(literal): // Acum definim tipul de opcode - înseamnă opcode invalid opcode = extract opcode(line); // determină locația codului de operare tip=search opcode table(opcode); // găsiți formatul, // de exemplu, OP REG REG if (type | Maarten [ ~ ->| Wiebern | | Frank | | Я-Я Gerrit | | I-H Cathy | | ~Я~Н Willem I [ Д>| Dick I | Anton | | Eric | | Orez Hashing: nume simbolice, valori și coduri hash derivate din nume simbolice (a); tabel hash de elemente cu o listă legată de nume și valori simbolice (b) Capitolul Nivel de asamblare Conectare și descărcare Majoritatea programelor conțin mai multe proceduri Compilatorii și asamblatorii traduc o procedură și scriu rezultatul pe disc Înainte de a rula programul, toate procedurile compilate trebuie găsite și legate Dacă memoria virtuală nu este disponibilă, programul legat trebuie încărcat direct în memoria principală Programele care îndeplinesc aceste funcții sunt numite variat: linkeri, încărcătoare de linkuri, linkere Traducerea completă a programului sursă necesită doi pași (Figura ): Compilarea sau asamblarea procedurilor sursă Aranjarea modulelor obiect Primul pas este efectuat de către asamblator sau compilator, al doilea de către linker Orez Pentru a obține un program binar executabil dintr-un set de proceduri traduse independent, se folosește un linker Traducerea unei proceduri sursă într-un modul obiect este un pas înainte, deoarece limbile sursă și țintă au comenzi și sintaxă diferite Cu toate acestea, la conectarea, nu există nicio tranziție la un alt nivel, deoarece programele din și din linker sunt pentru aceeași mașină virtuală Scopul linkerului este de a lega împreună toate procedurile care au fost traduse separat, astfel încât rezultatul să fie un cod binar executabil Pe sistemele MS-DOS, Windows / și Windows NT, modulele obiect au extensia obj, iar programele executabile au extensia exe În UNIX, modulele obiect au extensia o, dar programele executabile nu Compilatorii și asamblatorii traduc fiecare procedură sursă ca o unitate separată Există un motiv bun pentru asta Dacă un compilator sau un asamblator ar citi o serie întreagă de proceduri sursă și le-ar traduce imediat într-un program de limbaj mașină terminat, atunci schimbarea unei declarații în procedura sursă ar necesita retraducerea tuturor procedurilor sursă 